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Beschlufi des Prasidenten 
des Europaischen Patentamts 
vom 2. Oktober 1998 uber 
die Darstellung von Nucleotid- 
und Aminosauresequenzen 
in Patentanmeldungen und 
die Einreichung von Sequenz- 
protokoUen 



Oer Prasident des Europaischen 
Pacencamts, gestutzt auf Artikel 
10 EPU, Regein 27a und 49 EPU 
SQwie Regel 13^" PCX. beschlieQt: 



Arcikel 1 

Scandardisiene Darsceflung van 
Nucleodd- und Aminosauresequen- 
zen in europaischen Patentanmei- 
dungen 

Hat die in einer europaischen Patent- 
annneldung offenbarte Erfindung 
Nucleotid- oder Aminosauresequen- 
zen zum Gegenstand, so hat die 
Beschreibung ein Sequenzprotokoli 
2u enthalten, das denn im Anhang zu 
diesem BeschluG wiedergegebenen 
WIPO-Standard ST. 25 entspricht, 

Artikel 2 

Einreichung von SequenzprotokoUen 
auf elektronischem Dazentrager 

(1) Zusatzlich ist ein Oatentrager-mit 
dem Sequenzprotokoli einzureichen. 
der dem im Anhang zu diesem 
BeschluG wiedergegebenen Standard 
entspricht. 

(2) Wird ein Sequenzprotokoli nach 
seiner Einreichung beim Europai- 
schen Patentamt berichtigt, so ist ein 
neuer Datentrager mit dem berichtig- 
cen Sequenzprotokoli einzureichen. 



(3) Jedem Datentrager ist eine Erkia- 
rung des Anmelders beizufugen, daS 
die auf dem Datentrager gespeicherte 
information mit dem schriftlichen 
Sequenzprotokoli ubereinstimmt. 



Artikel 3 

Beseitigung von Mangein 

(1) Wird den in Regel 27a EPU und in 
den Artikein 1 und 2 dieses Beschlus- 
ses genannten Erfordernissen nicht 
entsprochen, so teilt die Eingangs- 
stelle dies dem Anmelder mit und 
fordert ihn auf, die festgestellten 
Mangel innerhalb einer Frist von 
zwei Monaten zu beseitigen (Rege! 
41(1) EPU). 



Decision of the President of 
the European Patent Office 
dated 2 October 1998 
concerning the presentation 
of nucleotide and amino 
acid sequences in patent 
applications and the filing 
of sequence listings 



The President of the European 
Parent Office, having regard to 
Aaicle 10 EPC, Rules 27a and 49 EPC 
and Rule 13*" PCT, has decided as 
follows: 

Article 1 

Scandardised presentation of nucleo- 
tide and amino acid sequences in 
European patent applications 



If the subject-matter of the invention 
disclosed in a European patent appli- 
cation is nucleotide or amino acid 
sequences, the description shall 
contain a sequence listing complying 
with'WIPO Standard ST. 25 repro- 
duced in the annex to this decision. 



Article 2 

Filing of sequence listings on elec- 
tronic data carriers 

(1) In addition, a data carrier shad be 
filed containing the sequence listing 
and complying with the standard 
reproduced in the annex to this 
decision, 

(2) If a sequence listing is corrected 
after being filed with the European 
Patent Office, a new data carrier 
containing the corrected sequence 
listing shall be filed. 



(3) Each data carrier shall be accom- 
panied by a statement by the appli- 
cant that the information recorded 
on the data carrier is identical to the 
written sequence listing. 



Article 3 

Rectification of deficiencies 

(1) If the requirements laid down in 
Rule 27a EPC and Articles 1 and 2 of 
this decision are not met. the Receiv- 
ing Section shall inform the applicant 
accordingly and invite him to remedy 
the disclosed deficiencies within 
a period of two months (Rule 4i(i) 
EPC). 



Decision du President de 
rOffice europeen des brevets, 
en date du 2 octobre 1998, 
relative a la presentation du 
listage des sequences de 
nucleotides et d'acides ami- 
nes dans les demandes de 
brevet et au depot de iistages 
des sequences 

Ls President de TOffice europeen des 
brevets, vu I'article 10 CBE. les regies 
27bis et 49 CBE ainsi que la regie 
13'" PCT, decide : 



Article premier 

Presentation norm a Usee du fistage 
des sequences de nucleotides et 
d'acides amines dans les demandes 
de brevet europeen 

Si rinvention exposee dans une 
demande de brevet europeen a pour 
objet des sequences de nucleotides 
ou d'acides amines, la description 
doit contenir un listage des sequen- 
ces etabli conformement a la norme 
ST. 25 de I'OMPi, reproduite dans 
I'annexe a la presente decision. 

Article 2 

Depot de Iistages des sequences sur 
support electronique de donnees 

tl) En outre, il y a lieu de deposer un 
support de donnees contenant un 
listage des sequences etabli confor- 
mement a la norme reproduite dans . 
I'annexe a ia presente decision. 

(2) Si un listage des sequences 
est rectifie apres avoir ete depose 
aupres de {'Office europeen des 
brevets, il y a lieu de deposer un 
nouveau support de donnees con- 
tenant le listage des sequences 
rectifie. 

(3) Tout support de donnees doit 
etre accompagne d'une declaration 
du demandeur selon laquelle I'infor- 
mation figurant sur ce support est 
identique a celle que contient le 
listage ecrit. 

Article 3 

Correction d'irregularites 

(1) S'il n'est pas satisfait aux exigen- 
ces visees a la regie 27bis CBE et aux 
articles premier et 2 de la presente 
decision, la section de depot te 
signale au demandeur et I'invite a 
remedier aux irregularites consta- 
tees dans un delai de deux mois 
(regie 41(1) CBE). 
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(2) Die Frist wird einmal um hoch- 
stens 2wei Monate verlangerc, sofern 
der Anmefder dies vor Ablauf der 
Frist beantragt. 



(3) 1st ein Datentrager beschadigt 
Oder aus einem anderen Grund nicht 
lesbar, so teilt die Eingangsstelle dies 
dem Anmelder mit und fordert ihn 
auf. einen neuen, einwandfrei lesba- 
ren Datentrager innerhaib einer von 
ihr zu besrimmenden Frist einzu- 
reichen. 

Arcikel 4 



(2) This period shall be extendable 
once only for a maximunrt of two 
months, provided the applicant 
requests such an extension prior to 
the expiry of the period. 

(3) if a data carrier is damaged, or 
unreadable for some other reason, 
the Receiving. Section shall inform 
the applicant accordingly and invite 
him to submit a flawless replacement 
within a period which it shall lay 
down. 



Article 4 



(2) Le delai est prolonge une seule 
fois de deux mois au maximum si le 
demandeur presente une requete en 
ce sens avani I'expiration du deiai. 



{2) Si un support de donnees est 
endommage ou rendu illisible pour 
quelque autre raison, la section de 
depot le signaie au demandeur et 
I'invite a deposer un nouveau 
support de donnees parfaitement 
lisible dans le deiai qu'elle iui 
impartit. 

Article 4 



Einreichung von Sequenzprotokoilen 
beim EPA a/s tnternationaler Recher- 
chenbehdrde 



In bezug auf Internationale Anmel- 
tjrjngen nach dem PCT.fur die nach 
Regei 5.2 PCT ein Sequenzprotokoll 
vorgeschrieben ist, verfahrt das 
Europaische Patentamt als Interna- 
tionale Recherchenbehprde nach 
Regel 13"M PCT und Abschnitten 
208 und 513 mit Anhang C der Ver- 
waltungsvorschriften zum PCT. 



fUing of sequence fisv'ngs with the 
EPO as International Searching 
Authority 



With regard to international applica- 
tions under the PCT, for which a 
sequence listing is prescribed under 
Rule 5.2 PCX the European Patent 
Office shall act as International 
Searching Authority in accordance 
with Rule 13''M PCT and Sections 208 
and 513 together with Annex C of the 
PCT Administrative Instructions. 



Depot de listages des sequences 
aupres de f'OEB agissant en quaiite 
d^administration chargee de la 
recherche Internationale 

En ce qui concerne les demandes 
internationales deposees au titre du 
PCT pour lesquelles la regie 5.2 PCT 
present un listage des sequences, 
I'Office europeen des brevets, agis- 
sant en quaiite d'administration 
chargee de ia recherche Internatio- 
nale, procede conformement aux 
dispositions de la regie 13"M PCT 
et aux instructions administratives 
208 et 513 du PCT, accompagnees 
de I'annexe C des Instructions 
administratives du PCT. 



Artike! 5 

Einreichung von Sequenzprotokoilen 
beim EPA a is Besximmungsamt oder 
als ausgewahltes Amt 

Bei Aufforderung zur Einreichung 
eines Sequenzprotokolls nach Regel 
104b {3a) EPO ist Artikel 3 entspre- 
chend anzuwenden. 



Artikel 6 

Veroffentlichung von Sequenz- 
protokoilen durch das EPA 

Ein am Anmeldetag der europaischen 
PatentBHTTieldung eingereichtes 
Sequenzprotokoll wird als Bestandteii 
der Beschreibung zusammen mit den 
Anmeldungsunterlagen veroffent- 
licht. Ein nach dem Anmeldetag 
eingereichtes oder berichtigtes 
Sequenzprotokoll wird, wenn es vor 
dem Zeitpunkt voriiegt, an dem die 
technischen Vorbereitungen ftir die 
Veroffentlichung als abgeschlossen 
gelten, als Aniage zu den Anmel- 
dungsunterlagen, andernfalls, bei 
Patenterteilung, als Aniage zur euro- 
paischen Patentschrift veroffeniiicht. 



Article 5 

Filing of sequence listings with the 
EPO as designated Office or elected 
Office 

Where an applicant is invited to file a 
sequence listing in accordance with 
Rule 104b(3a) EPC, Article 3 shall 
apply mutatis mutandis. 



Article 6 

Publication of sequence listings by 
the EPO 

A sequence listing filed on the date of 
filing of the European patent appli- 
cation shall be published together 
with the application documents as 
part of the description. A sequence 
listing filed or corrected after the date 
of filing shall be published as an 
annex to the application documents, 
provided it is received before the 
date on which the technical prepara- 
tions for publication are deemed to 
have been completed; otherwise, it 
shall be published as an annex to the 
European patent specification when 
the patent is granted. 



Article 5 

Depot de iistages des sequences 
aupres de rOEB agissant en tant 
qu' office designe ou elu 

Lors de I'envoi d'une invitation a 
deposer un.listage des sequences 
conformement a la regie 104ter (3bis) 
CBE, I'article 3 est applicable par 
analogie. 

Article 6 

Publication par rOEB de listages des 
sequences 

Un listage des sequences depose a 
la date de depot de la demande de 
brevet europeen est pubtie comme 
element de la description avec les 
documents de la demande. Si un 
listage des sequences depose ou 
rectifie apres la date de depot est 
disponibie avant la date a laquelle les 
preparatifs techniques entrepris en 
vue de la publication de la demande 
sont reputes acheves, it est publie en 
annexe aux documents de la 
demande. ou, si ce n'est pas le cas, 
lors de la delivrance du brevet, en 
annexe au fascicule du brevet 
europeen. 
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Anikel 7 
Inkrafttrecen 

Dieser BeschluB trirt am 1. Januar 
1999 in Kraft und ersetzt den 
BeschluB vom 11. Oezember 1992. 
Beilage Nr. 2 zu ABI. EPA 12/1992/l. 



Geschehen zu Munchen am 
2. Oktober 1998 



Article 7 

Entry Into force 

This decision shall enter into force 
on 1 January 1999 and shall replace 
the decision dated 1 1 December 
1992, Supplement No. 2 to OJ EPO 
12/1992. 1. 

Done at Munich, 2 October 1998 



Article 7 



Entree en vigueur 

La presente decision entre en vigueur 
le Janvier 1999 et remplace la 
decision du 11 decembre 1992, 
publiee dans le supplement n-* 2 au 
Journal officiel 12/1992. 1. 

Fait a Munich, le 2 octobre 1998 



INCO K08ER 
President 



INCO KOBER 
President 



INGO KOBER 
President 
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ANHANG zum Beschluli des 
Prasidenten des Europaischen 
Patentamts vom 2. Oktober 
1998 Gber die Darstellung von 
Nucleotid- und Aminosaure- 
sequenzen in Patentanmel- 
dungen und die Einreichung 
von Sequenzprotokollen 



WIPO-Standard ST. 25 

Standard fur die Darstellung von 
Nucleotid- und Aminosauresequenz- 
protokollen in Patentanmeldungen 



Vom (ausfuhrenden) PClPl-Koordinie- 
rungsausschufS in seiner zweiund- 
zwanzigsten Sitzung am 28. Mai 1998 
angenommener Standard 

Qen Amtern wird empfohlen, die 
Vorschriften des "Standards fur die 
Darstellung von Nucleotid- und 
AminosauresequenzprotokoMen in 
internationalen Patentanmeldungen 
nach dem Verrrag uber die interna- 
tionale Zusammenarbeit auf dem 
Gebiet des Patentwesens (PCT)", die 
in Anhang C zu den Verwaltungs'vor- 
schriften zum PCT enthalten sind. 
auch auf solche Patentanmeldungen 
anzuwenden, die keine internatio- 
nalen Anmeldungen nach dem PCT 
sind, wobei zu beachten ist, dafS 
bestimmte Vorschriften, die auf 
PCT-spezifische Verfahren und 
Erfordernisse zugeschnitten sind, auf 
Patentanmeldungen, die keine 
internationalen Anmeldungen nach 
dem PCT sind, moglicherweise keine 
Anwendung finden.* Der Woaiaut 
des PCT-Standards ist nachfolgend 
wiedergegeben. 



ANNEX to the Decision of the 
President of the European 
Patent Office dated 2 October 
1998 concerning the presen- 
tation of nucleotide and 
amino acid sequences in 
patent applications and the 
filing of sequence listings 



WlPO Standard ST, 25 

Standard for the presentation of 
nucleotide and amino acid sequence 
listings in patent applications 



Standard adopted by the PCIPI 
Executive Coordination Committee 
at its twenty-second session on 
May 28, 1998 

It is recommended that Offices apply 
the provisions of the "Standard for 
the Presentation of Nucleotide and 
Amino Acid Sequence Listings in 
International Patent Applications 
Under the Patent Cooperation Treaty 
(PCT)" as sat out in Annex C to the 
Administrative Instructions under the 
PCT, mutatis mutandis, to all patent 
applications other than the PCT inter- 
national applications, noting that 
certain provisions specific to PCT 
procedures and requirements may 
not be applicable to patent applica- 
tions other than PCT international 
applications." The text of that PCT 
Standard is reproduced on the 
following pages. 



ANNEXE a la decision du 
President de I'Office europeen 
des brevets, en date du 
2 octobre 1998, relative a la 
presentation du listage des 
sequences de nucleotides 
et d'acides amines dans 
les demandes de brevet et 
au depot de listages des 
sequences 

Norme ST. 25 de KOMPI 

Norme relative a la presentation 
du listage des sequences de 
nucleotides et d'acides amines 
dans les demandes de brevet 

Norme adoptee par le Comite 
executif de coordination du PCiPI 
a sa vingt-deuxieme session 



II est recommande que les offices 
appliquent les dispositions de la 
"Norme relative a la presentation du 
listage des sequences de nucleotides 
et d'acides amines dans les deman- 
des internationales de brevet depo- 
sees selon le Traite de cooperation en 
matiere de brevets (PCT)", qui figure 
a I'annexe C des Instructions adminis- 
tratives du PCT, pour toutes les 
demandes de brevet autres que les 
demandes internationales deposees 
selon le PCT, sous reserve des modi- 
fications necessaires compte tenu du 
fait que certaines dispositions pro- 
pres aux procedures et prescriptions 
deflnies dans le cadre du PCT peu- 
vent ne pas etre applicables aux 
demandes de brevet autres que les 
demandes internationales deposees 
selon le PCT.' Le texte de cene norme 
du PCT est reproduit ci-apres. 



• 1st am t. Jui; 1998 di« fur .in Amt g.ltand. nacionjle 
G«»engeoung und Recntspraxis niche mic dan Var- 
lertnfian dar antan baidan Siaa in Absati 3 das 
'Standards fur dim OarstaKung von Nuclaotid- und 
Aminosaurasaauaniprotokollan in intarnationaf an 
Pstanranmaidungan nacrt dam V^irtrag Qbar dia 
inrernationala Zu »a mm an arts a. i au/ dam Gabiat das 
Patencwasans (PCT)- vereinbar. so srahi as diasam 
Amt frti. dia betrartanden Vomchriften nicht nj 
bafolgan, solango dia Unvarainoarl(ait bastanL 



If, on July I. 1998. tha national law and pracrica appti- 
cabia by an Offica is not compatibia with tha provis. 
ions of tha first two sentancas of paragraph 3 of 
tha 'Standard for cha Prasantation of Nuctaotida 
and Amino Add Saauanca Usitngs in Intarnational 
Patant Applications Undar tha Patant Cooparation 
Traarv (PC71," that Offica may choosa noi to follow 
thosa provisions for as long as that incompatibility 
continues. 



• SJ. la 1" juillat 1998. fa lagislation ar la pratiqu* nai'O- 
nalas aopliquaas par un offica na sont pascompa* 
tiblas avec las dispositions das daux pramiaras 
phrases du paragraohe 3 de la 'Norma relative a 
la presentation du listaga des saquencas da nudao- 
tides at d'actdas amines dans las demandes interna* 
tionalas da brevet deposees selon la Traiie de 
cooperation an matiere da brevets (PCTl'. rofice 
peut Choisir da ne pas aopliquar ces dispositions 
tant qua I'incompatibilita demaura. 
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Anhang C zu den PCT- 

Verwaltungsvorschriften 

Standard fur die Darstellung von 
Nucleotid- und Aminosauresequenz- 
protokollen in internationalen 
Patentanmeldungen nach dem PCX 



eiNFUHRUNG 

1. Mit dem vorliegenden Standard 
soil auf eine srandardisiene Darstel- 
lung von Nucleotid- und Aminosaure- 
sequenzprotokollen in internationa- 
len Patentanmeldungen hingewirkt 
werden. Anhand dieses Standards 
kann der Anmelder ein einheitliches 
Sequenzprotokoll erstellen, das von 
alien Anmeideamtern, Internationa- 
len Recherchenbehorden und mit der 
internationalen vorlaufigen Prufung 
.'.beauftragten Behdrden fur die 
Zwecke der internationalen Phase 
und von alien Bestimmungsamtern 
und ausgewahlten Amtern fur die 
Zwecke der nationalen Phase akzep- 
tiertwird. Der Standard soil ferner 
eine genauere und quaiitativ bessere 
Darstellung von Nucleotid- und 
Aminosauresequenzen in internatio- 
nalen Anmeldungen sicherstellen, die 
Darstellung und Verbreitung der 
Sequenzen zum Nutzen der Anmel- 
der, der Offentlichkeit und der Prufer 
erleichtern, die Recherche von 
Sequenzdaten vereinfachen und den 
Austausch dieser Daten in elektroni- 
scher Form sowie ihre Aufnahme tn 
computergestutzte Datenbanken 
ermoglichen. 



Annex C to the PCT 

Administrative Instructions 

Standard for the presentation of 
nucleotide and amino acid sequence 
listings in international patent appli- 
cations under the PCT 



INTRODUCTION 

1. This Standard has been elaborated 
so as to provide standardization of 
the presentation of nucleotide and 
amino acid sequence listings in inter- 
national patent applications. The 
Standard is intended to allow the 
applicant to draw up a single 
sequence listing which is acceptable 
to all receiving Offices, International 
Searching and Preliminary Examin- 
ing Authorities for the purposes of 
the international phase, and to all 
designated and elected Offices for 
the purposes of the national phase. 
It is intended to enhance the accu- 
racy and quality of presentations of 
nucleotide and amino acid sequences 
given in international applications, to 
make for easier presentation and 
dissemination of sequences for the 
benefit of applicants, the public and 
examiners, to facilitate searching 
of sequence data and to allow the 
exchange of sequence data in elec- 
tronic form and the introduction of 
sequence data onto computerized 
databases. 



Annexe C des Instructions 
administratives du PCT 

Norme relative a la presentation du 
listage des sequences de nucleotides 
et d'acides amines dans les deman- 
des internationales de brevet depo- 
sees selon le PCT 

INTRODUCTION 

1. La presente nprme a ete elaboree 
pour normaliser la presentation du 
listage des sequences de nucleotides 
et d'acides amines dans les deman- 
des internationales de brevet. EHe 
vise a permettre au deposant d'eta- 
biir un listage unique qui soil accep- 
table pour tous les offices recepteurs, 
toutes les administrations chargees 
de la recherche internationale et les 
administrations chargees de I'exa- 
men preliminaire international aux 
fins de la phase internationale, ainsi 
que pour tous les offices designes ou 
eius aux fins de la phase nationale. 
Elle vise aussi a accrottre la precision 
et la qualite de la presentation des 
sequences de nucleotides et d'acides 
amines dans les demandes interna- 
tionales, a faciliter la presentation et 
la diffusion des sequences dans 
I'interet des deposants, du public 
et des examinateurs, a faciliter la 
recherche de donnees sur ces 
sequences ainsi qu'a permettre 
I'echange de donnees sur les sequen- 
ces sous forme electronique et Tin- 
corporation de ces donnees dans les 
bases de donnees informatisees. 



DEFINITIONEN 

2. Im Rahmen dieses Standards 
gelten folgende Definttionen: 

i) Untereinem "Sequenzprotokoll" ist 
ein Teil der Beschreibung der Anmel- 
dung in der eingereichten Fassung 
Oder ein zur Anmeldung nachgereich- 
tes Schriftstuck zu verstehen, das die 
Nucleotid- und/oder Aminosaure- 
sequenzen ttti einzelnen offenbart 
und sonstige verfugbare Angaben 
enchalt. 

ii) In das Protokoll durfen nur unver- 
zweigte Sequenzen von mindestens 
*i Aminosauren bzw. unverzweigte 
Sequenzen von mindestens 

10 Nucleotiden aufgenommen 
werden. Verzweigte Sequenzen, 
Sequenzen mit weniger als 4 genau 
definierten Nucleotiden oder Amino- 
sauren sowie Sequenzen mit Nucleo- 
tiden Oder Aminosauren, die nicht in 
Anhang 2, Tabellen 1, 2, 3 und 4 
aufgefuhrt sind, sind ausdrucklich 
ausgenommen. 

iii) Unter "Nucleotiden" sind nur 
Nucleotide zu verstehen, die mittels 
der in Anhang 2, Tabelle 1 aufge- 



DEFINITIONS . . 

2. For the purposes of this Standard: 

(i) the expression "sequence listing" 
means a part of the description of the 
application as filed or a document 
filed subsequently to the application, 
which gives a detailed disclosure 

of the nucleotide and/or amino 
acid sequences and other available 
information; 

(ii) sequences which are included are 
any unbranched sequences of four or 
more amino acids or unbranched 
sequences of ten or more nucleo- 
tides. Branched sequences, sequen- 
ces with fewer than four specifically 
defined nucleotides or amino acids 
as well as sequences comprising 
nucleotides or amino acids other 
than those listed in Appendix 2, 
Tables 1, 2, 3 and 4, are specifically 
excluded from this definition; 



(iii) "nucleotides" embrace only 
those nucleotides that can be rep- 
resented using the symbols set forth 



DEFINITIONS 

2. Aux fins de la presente norme, 

(i) I'expression "listage des sequen- 
ces" designe une partie de la descrip- 
tion figurant dans la demande au 
moment de son depot, ou un docu- 
ment depose apres la demande, 

qui divulgue de fagon detaillee les 
sequences de nucleoTides ou d'acides 
amines ainsi que d'autres informa- 
tions disponibles ; 

(ii) le terme "sequences" designe 
des sequences Itneaires d'au moins 
quatre acides amines ou des sequen- 
ces lineaires d'au moins dix nucleo- 
tides. Les sequences non lineaires, 
les sequences a moins de quaere 
nucleotides ou acides amines spe- 
cialement definis, ainsi que les 
sequences comprenant des nucleo- 
tides ou des acides amines differents 
de ceux qui sont enumeres dans les 
tableaux 1, 2, 3 et 4 de I'appendice 2 
sont expressement exclues de cette 
definition ; 

(iii) le terme "nucleotides" designe 
uniquement les nucleotides qui 
peuvent eire representes a I'aide des 
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fuhrten Symbole wiedergegeben 
werden konnen. Modifikationen wie 
z. 8. methytlerte Basen konnen nach 
der Anteitung in Anhang 2. Tabelle 2 
beschrieben werden. sind aber in der 
Nucleotidsequenz nicht explizit aus- 
zuweisen. 



iv) Unter " Aminosauren" sind die 
in Anhang 2. Tabeiie 3 aufgefuhnen 
gangigen L-Aminosauren aus den 
naturlich vorkommenden Proteinen 
2u verstehen. Aminosauresequenzen, 
die mindestens eine D-Aminosaure 
enthalten, fallen nicht unter diese 
Definition. Aminosauresequenzen. 
die posrtranstational nnodifiziene 
Aminosauren enthalten, konnen 
nninels der in Anhang 2, Tabelle 3 
aufgefuhnen Synnboie wie die 
ursprunglich cranslatierte Amino- 
saure beschrieben werden, wobei 
die modifiziercen Posrtionen wie z. B. 
Hydroxylterungen Oder Glykosilie- 
rungen nach der Anieitung in 
Anhang 2, Tabelle 4 beschrieben 
werden. diese Modifikationen aber in 
der Aminosauresequenz nicht explizit 
auszuweisen sind. Unter die vorste- 
hende Definition fallen auch Peptide 
Oder Proteine, die anhand der in 
Anhang 2, Tabelle 3 aufgefuhrcen 
Symboie sowte einer an anderer 
Stelle aufgenommenen Beschrei- 
bung, die beispielswetse AufschluG 
uber ungewohnltche Bindungen, 
Quervernerzungen (z. B. Disulfid- 
brucken) und "end caps", Nichtpep- 
tidbindungen usw. gtbt, als Sequenz 
wiedergegeben werden konnen. 



v) Unter "Sequenzkennzahl" ist elne 
Zahi zu verstehen, die jeder im Pro- 
tokoll aufgefuhrten Sequenz als SEQ 
ID NO zugewiesen wird- 

vi) Die "numerische Kennzahi" ist 
eine dreistellige Zahl, die fur ein 
bestimmtes Datenelement steht. 

vii) Unter "sprachneutralem Voka- 
bular' isT ein festes Vokabularzu 
verstehen, das im Sequenzprotokoll 
zur Wiedergabe der vom Hersteller 
einer Sequenzdatenbank vorgeschrie- 
benen wtssenschaftlichen Begriffe 
verwendet wird (dazu gehoren wis- 
senschaftliche Namen, nahere 
Sestimmungen und ihre Entspre- 
chungen im festen Vokabular, die 
Symboie in Anhang 2, Tabellen 1. 2, 3 
und 4 und die MerkmalschlGssel in ' 
Anhang 2, Tabellen 5 und 6). 

viii) Unter "zustandiger Behorde" 
ist die Internationale Recherchenbe- 
horde oder die mit der internatio- 
nalen vorlaufigen Prufung beauf- 
tragte Behorde, die die internationale 
Recherche bzw. die internationale 



in Appendix 2. Table 1. Modifications, 
for example, methylated bases, 
may be described as set forth in 
Appendix 2. Table 2. but shall not 
be shown explicitly in the nucleotide 
sequence; 



(iv) "amino acids" are those L-amino 
acids commonly found in naturally 
occurring proteins and are listed 
in Appendix 2. Table 3. Those amino 
acid sequences containing at least 
one D-amino acid are not intended to 
be embraced by this definition. Any 
amino acid sequence that contains 
post-translationally modified amino 
acids may be described as the amino 
acid sequence that is initially trans- 
lated using the symbols shown in 
Appendix 2, Table 3. with the modi- 
fied positions, for example, hydrox- 
ylations or glycosylations, being 
described as set forth in Appendix 2, 
Table 4., but these modifications shall 
not be shown explicitly in the amino 
acid sequence. Any peptide or 
protein that can be expressed as a 
sequence using the symbols in 
Appendix 2, Table 3, in conjunction 
with a description elsewhere to 
describe, for example, abnormal 
linkages, cross-links (for example, 
disulfide bridge) and end caps, non- 
peptidyl bonds, etc., is embraced 
by this definition; 



(v) "sequence identifier" is a unique 
integer that corresponds to the S£Q 
ID NO assigned to each sequence in 
the listing; 



(vi) "numeric identifier" is a three- 
digit number which represents a 
specific data element; 



(vii) "language-neutral vocabulary" 
is a controlled vocabulary used in 
the sequence listing that represents 
scientific terms as prescribed by 
sequence database providers (includ- 
ing scientific names, qualifiers and 
their controlled-vocabulary values, 
the symbols appearing In Appen- 
dix 2, Tables 1, 2, 3 and 4, and the 
feature keys appearing in Appen- 
dix 2, Tables 5 and 6; 



(viii) "competent Authority" is the 
International Searching Authority 
that is to carry out the international 
search on the international applica- 
tion, or the International Preliminary 
Examining Authority that is to carry 



symboles indiques dans le tablea i 
de I'appendice 2. Les rri edifications 
(par exemple, les bases methyiees) 
peuvent etre decrites de la maniere 
indiquee dans le tableau 2 de 
I'appendice 2, mais eltes ne doivent 
pas etre presentees de fa(;on explicite 
dans la sequence de nucleotides ; 

(iv) le terme "acides amines" designe 
les acides amines L que I'on rencon- 
tre generalement dans des proteines 
naturelles et qui sont enumeres 
dans le tableau 3 de I'appendice 2. 
N'entrent pas dans cette definition 
les sequences d'acides amines qui 
contiennent au moins un acide 
amine D. Toute sequence d'acides 
amines qui contient des acides 
amines modifies apres traduction 
peut etre representee sous la forme 
de la sequence initialement traduite a 
I'aide des symboles indiques dans le 
tableau 3 de I'appendice 2. les posi- 
tions modifiees (par exemple hydro- 
xylations ou glycosylations) etant 
elles-memes decrites de la maniere 
indiquee dans le tableau 4. de 
I'appendice 2 ; ces modifications ne 
doivent toutefois pas etre represen- 
tees de fa^on explicite dans la 
sequence d'acides amines. Entre 
dans cene definition tout peptide ou 
toute proteine qui peut etre expri- 
me(e) sous forme de sequence a 
I'aide des symboles enumeres dans 
le tableau 3 de I'appendice 2 et 
accompagne(e), par exemple, d'une 
description des liaisons anormales, 
des liaisons croisees (p. ex. ponts 
disulfure) et des coiffes terminales, 
des liaisons non peptidiques, etc. ; 

(v) I'expression "identiflcateur de 
sequence" designe un nombre entier 
unique correspondant au SEQ ID NO 
attribue a chaque sequence figurant 
dans le iistage ; 

(vi) I'expression "identificateur 
numerique" designe un numero 
a trois chiffres qui represente un 
element de donnee determine ; 

(vii) {'expression "vocabulaire non 
connote" designe un vocabulaire 
controie utilise dans le Iistage des 
sequences qui represente des termes 
scientifiques de la fa(;on prescrite par 
les fournisseurs de bases de donnees 
contenant des sequences (y compris 
des noms scientifiques, des quali- 
ficatifs et leur valeur en termes de 
vocabulaire controie, les symboles 
figurant dans les tableaux 1, 2, 3 et 4 
de I'appendice 2, et les cles de carac- 
terisation, dans les tableaux 5 et 6 

de I'appendice 2) ; 

(viii) I'expression "administration 
competente" designe I'administra- 
tion chargee de la recherche interna- 
tionale ou I'administration chargee 
de I'examen preliminaire interna- 
tional pour la demande internationale 
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/orlaufige Prufung zu der interna- 
:ionalen Anmeldung durchfuha, Oder 
jas aestimmungsamt bzw. ausge- 
A/ahlce Amt zu verstehen, das mit der 
3earbeitung der internationalen 
Anmeldung begonnen hat. 



out the international preliminary 
e.xamination on the international 
application, or the designated/elected 
Office before which the processing 
of the international application has 
started. 



en question, ou encore Toffice desi- 
gne ou elu au sein duquel le traite- 
ment de la demande iniernationale 
a commence. 



5EQUEN2PROTOKOLL 

3. Das Sequenzprotokoll im Sinne der 
\Jummer 2 i) ist ans Ende der Anmel- 
dung zu setzen. wenn es mit ihr 
!usammen eingereicht wird. Dieser 
feil ist mit "Sequenzprotokotr zu 
jberschreiben, muE mit einer neuen 
Seite beginnen und sollte gesondert 
numerierc werden. Das Sequenzpro- 
cokoll ist Bestandteil der Beschrei- 
bung; vorbehaltlich Nummer 36 
erubrigt es sich deshalb, die Sequen- 
zen.in der Beschreibung an anderer 
Scelle nochmals zu beschreiben. 



a. Wird das Sequenzprotokoll im 
Sinne der Nummer 2 i) nicht zusam- 
men mit der Anmeldung eingereicht. 
sondern als gesondertes Schriftstuck 
nachgereicht (s. Nr. 37), so ist es mit 
der Uberschrift "Sequenzprotokotr 
und einer gesondenen Seitennume- 
rierung zu versehen. Die in der 
Anmeldung in der eingereichten 
Fassung gewahlte Numerierung der 
Sequenzen (s. Nr. 5) ist auch im 
nachgereichten Sequenzprotokoll 
beizubehalten. 



5. Jeder Sequenz wird eine eigene 
Sequenzkennzahl zugeteilt. Die Kenn- 
zahlen beginnen mit 1 und setzen 
sich in aufsteigender Reihenfolge als 
ganze Zahlen fort. Gibt es zu einer 
Kennzahl keine Sequenz, so ist am 
Anfang der auf die S6Q ID NO foigen- 
den Zeile unter der numerischen 
Kennzahl <400> der Code 000 anzu- 
geben. Unter der numerischen 
Kennzahl <160> ist die Gesamtzahl 
der SEQ.ID NOs anzugeben, und zwar 
unabhangig davon, ob im AnschluG 
an eine SEQ ID NO eine Sequenz- 
kennzahl Oder der Code 000 folgt. 

6. In der Beschreibung. in den 
Anspruchen und in den Zeichnungen 
der Anmeldung ist auf die im 
Sequenzprotokoll dargestellten 
Sequenzen mit "SEQ ID NO", gefolgt 
von der betreffenden Kennzahl, 

zu verweisen. 

7. Fur die Darstellung von Nucleotid- 
und Aminosauresequenzen ist 
zumindest eine der folgenden drei 
Mogiichkeiten zu wahlen: 

il nur Nucleotidsequenz 

ii) nur Aminosauresequenz 

iii) Nucleotidsequenz zusammen 

mit der entsprechenden Aminosaure- 
sequenz 



SEQUENCE LISTING 

3. The sequence listing as defined in 
paragraph 2{i) shall, where it is filed 
together with the application, be 
placed at the end of the application. 
This part shall be entitled "Sequence 
Listing." begin on a new page and 
preferably have independent page 
numbering. The sequence listing 
forms an integral part of the descrip- 
tion; it is therefore unnecessary, 
subject to paragraph 36. to describe 
the sequences elsewhere in the 
description. 



4. Where the sequence listing as 
defined in paragraph 2(i) is not 
contained in the application as filed 
but is a separate document furnished 
subsequently to the filing of the 
application (see paragraph 37), it 
shall be entitled "Sequence Listing" 
and shall have independent page 
numbering. The original numbering 
of the sequences (see paragraph 5) 
in the application as filed shall be 
maintained in the subsequently 
furnished sequence listing. 



5. Each sequence shall be assigned 
a separate sequence identifier. The 
sequence identifiers shall begin 
with 1 and increase sequentially by 
integers. If no sequence is present for 
a sequence identifier, the code 000 
should appear under numeric 
identifier <4.00>. beginning on the 
next line following the SEQ ID NO. 
The response for numeric identifier 
<160> shall include the total number 
of SEQ ID NOs, whether followed by 
a sequence or by the code 000. 



6. In the description, claims or 
drawings of the application, the 
sequences represented in the 
sequence listing shall be referred 
to by the sequence identifier and 
preceded by "SEQ ID NO:". 



7. Nucleotide and amino acid 
sequences should be represented by 
at least one of the following three 
possibilities: 

(i) a pure nucleotide sequence; 

(ii) a pure amino acid sequence; 

(iii) a nucleotide sequence together 
with its corresponding amino acid 
sequence. 



LISTAGE DES SEQUENCES 

3. Le listage des sequences defini au 
paragraphe 2.i) doit, lorsqu'il est 
depose en meme temps que la 
demande, etre place a la fin de 
celle-ci. Ceae partie de la demande 
doit s'intituler "listage des sequen- 
ces", commencer de preference sur 
une nouveile page et faire I'objet 
d'une pagination distincte. Le listage 
des sequences fait partie integrante 
de ta description ; ii n'est done pas 
necessaire, sous resen/e du para- 
graphe 36, de decrire les sequences 
ailleurs dans la description. 

4. Lorsque le listage des sequences 
defini au paragraphe 2.i) ne figure 
pas dans la demande telle qu'elle a 
ete deposee mais constitue un docu- 
ment distinct remis apres le depot de 
la demande (voir le paragraphe 37), 

il doit s'intituler "Listage des sequen- 
ces" et faire I'objet. d'une pagination 
distincte. La numerotation des 
sequences (voir le paragraphe 5) 
figurant dans la demande telle qu'elle 
a ete deposee doit etre maintenue 
dans un listage des sequences remis 
ulterieurement. 

5. A chaque sequence doit etre artri- 
bue un identificateur de sequence 
distinct, ia progression numerique 
etant saquentielle et commen<;ant 

a 1. Lorsque aucune sequence ne 
figure sous Tidenttficateur de 
sequence, le code 000 doit apparaitre 
sous ridentificateur numerique 
<400>, en commen^ant sur la ligne 
qui suit la mention SEQ ID NO. En 
regard de ridentificateur nume- 
rique <160> doit etre indique le 
nombre total de sequences, suivi 
d'une sequence ou du code 000. 



6. Dans la description, les revendica- 
tions ou les dessins de la demande, 
toute sequence du listage a laquelle il 
est fait reference doit etre designee 
par son identificateur de sequence 

et precedee de ta mention "SEQ ID 
NO :". 

7. Les sequences de nucleotides et 
d'acides amines doivent etre repre- 
sentees au moins sous Tune des trois 
formes suivantes : 

(i) une sequence de nucleotides pure ; 
(it) une sequence d'acides amines 
pure :. 

(iii) une sequence de nucleotides et 
sa sequence d'acides amines 
correspondante. 
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Bet einer Offenbarung im unter Ziffer 
iri genonnten Format muG die Amino- 
sauresequenz als solche im Sequenz- 
protokoli mit einer eigenen Sequenz- 
kennzahl gesondert offenbart werden. 



NUCLEOTIDSEQUENZEN 
Zu venjvendende Symbole 

8. Nucleotidsequenzen sind nur 
anhand eines Einzelstrangs in Rich- 
tung vom 5'-Ende zum 3'-Ende von 
links nach rechts wiederzugeben. 
Die Begriffe 3' und 5' werden in der 
Sequenz niche dargestellt. 

9. Die Basen einer Nucleotidsequenz 
sind anhand der einbuchstabigen 
Codes fur Nucieotidsequenzzeichen 
darzustellen. Es durfen nur die in 
Anhang 2, Tabelle 1 aufgefuhrten 
Kleinbuchstaben ven/vendet werden. 



10. Modifizierce Basen sind in der 
Sequenz selbst wie die entsprechen- 
den unmodifizierten Basen oder mit 
"n" wiederzugeben, wenn die modr- 
fizierte Base zu den in Anhang 2, 
Tabelle 2 aufgefuhrten gehort; die 
Modifikation ist im MerkmalsTeil des 
Sequenzprotokolls anhand der Codes 
in Anhang 2, Tabelle 2 naher zu 
beschreiben. Diese Codes durfen in 
der Beschreibung oder im Merkmals- 
teii des Sequenzprotokolls, nicht 
jedoch in der Sequenz selbst ver- 
wendet werden (s. auch Nr. 32). Das 
Symbol "n" steht immer nur fur ein 
einziges unbekanntes Oder modi- 
fiziertes Nucleotid. 



Zu vsPA/endendes Format 

n. Bei Nucleotidsequenzen sind 
h£ichstens 60 Basen pro Zeile -mir 
einem Leerraum zwischen jeder 
Gruppe von 10 Basen -aufzufuhren. 

12. Die Basen einer Nucleotidsequenz 
{einschlieGIich Intronen) sind jeweils 
in Zehnergruppen aufzufuhren; dies 
gilt nicht fur die codierenden Teile 
der Sequenz. Bleiben am Ende nicht- 
codierender Teile einer Sequenz 
weniger ais 10 Basen ubrig, so sind 
sie zu einer Gruppe zusammenzufas- 
sen und durch einen Leerraum von 
angrenzenden Gruppen zu trennen. 

13. Die Basen der codierenden Teile 
einer Nucleotidsequenz sind als 
Triplens (Codonen) aufzufuhren. 
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For those sequences disclosed in the 
format specified in option (iii), above, 
the amino acid sequence must be 
disclosed separately in the sequence 
listing as a pure amino acid sequence 
with a separate integer sequence 
identifier. 



NUCLEOTIDE SEQUENCES 
Symbols to Be Used 

8. A nucleotide sequence shall be 
presented only by a single strand, in 
the 5'-end to 3'-end direction from 
left to right. The terms 3' and 5* shall 
not be represented in the sequence. 

9. The bases of a nucleotide 
sequence shall be represented using 
the one-letter code for nucleotide 
sequence characters. Only lower case 
leners in conformity with the list 
given in Appendix 2, Table 1, shall be 
used. 

10. Modified bases shall be rep- 
resented as the corresponding un- 
modified bases or as "n" in the 
sequence itself if the modified base is 
one of those listed in Appendix 2, 
Table 2, and the modification shall 

be further described in the feature 
section of the sequence listing, 
using the codes given in Appendix 2, 
Table 2. These codes may be used in 
the description or the feature section 
of the sequence listing but not in the 
sequence itself (see also para- 
graph 32). The symbol "n" is the 
equivalent of only one unknown 
or modified nucleotide. 



Format to Be Used 

11. A nucleotide sequence shall be 
listed with a maximum of 60 bases 
per line, with a space between each 
group of 10 bases. 



12. The bases of a nucleotide 
sequence (including introns) shall 
be listed in groups of 10 bases, 
except in the coding parts of the 
sequence. Leftover bases, fewer 

. than 10 in number at the end of non- 
coding parrs of a sequence, should 
be grouped together and separated 
from adjacent groups by a space. 

13. The bases of the coding parts of a 
nucleotide sequence shall be listed as 
triplets (codons). 



En ce qui concerne les sequences 
divulguees selon le mode de presen 
tacion indique sous iii), la sequence 
d'acides amines doit etre divulguee 
separement dans le listage des 
sequences en tant que sequence 
d'acides amines pure assortie d'un 
identificateur de sequence distinct. 

SEQUENCES OE NUCLEOTIDES 
Symboles a utilise r 

8. Toute sequence de nucleotides doit 
etre representee par un seul brin de 
codage, dans le sens 5-3' et de 
gauche a droite. Les valeurs 3' et 5' 
ne doivent pas etre representees 
dans la sequence. 

9. Les bases d'une sequence de 
nucleotides doivent etre representees 
au moyen du code a une lenre utilise 
pour les sequences de ce type. 
Seules les lertres minuscules indi- 
quees dans le tableau 1 de I'appen- 
dice 2 doivent etre utilisees. 

10. Les bases modifiees doivent etre 
representees par les bases non modi- 
fiees correspondantes contenues 
dans la sequence elle-meme (ou au 
moyen du symbole "n") lorsque la 
base modifiee figure parmi celles qui 
sont enumerees dans le tableau 2 de 
I'appendice 2 ; la modification doit 
faire Tobjet d'une description plus 
detaillee dans la section "caracteris- 
tiques" du listage des sequences, a 
I'aide des codes enumeres dans le 
tableau 2 de I'appendice 2. Ces codes 
peuvent etre utilises dans la descrip- 
tion ou dans la partie "caracteris- 
tiques" du listage des sequences 
mais pas dans la sequence propre- 
ment dite (voir aussi le paragraphe 
32). Le symbole "n" est I'equivalent 
d'un seul nucleotide inconnu ou 
modifie. 

Mode de presentation a suivre 

11. Une sequence de nucleotides 
doit comporter 60 bases par ligne 
au maximum, avec un espace entre 
chaque codon ou groupe de 

10 bases. 

12. Les bases d'une sequence de 
nucleotides (y compris les introns) 
doivent figurer sur la liste par grou- 
pes de 10 bases, sauf celles qui se 
situent dans les regions codantes de 
la sequence. Les bases {moins de 10) 
qui restent a I'extremite des regions 
non codantes d'une sequence 
doivent etre regroupees et separees 
des groupes voisins par un espace. 

13. Les bases des regions codantes 
d'une sequence de nucleotides 
doivent figurer sur la liste sous forme 
de triplets (codons). 
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Iti. Die Zahfung der Nucleoridbasen 
beginnt bet der ersten Base der 
Sequenz mil 1. Von hier aus isr die 
gesamce Sequenz in 5'-3*-Rich:ung 
fortlaufend durchzuzahlen. Am 
rechten Rand ist jewetis neben der 
Zeile mit den einbuchstabigen Codes 
fur die Basen die Nummer der tetzten 
Base dieser Zeiie anzugeben. Die 
vorstehend beschriebene Zahlweise 
fur Nucieoiidsequenzen gilt auch fur 
Nucieotidsequenzen mit ringformiger 
Konfiguration, wobei allerdings 
die Bestimmung des ersren Nucleo- 
tids der Sequenz dem Anmelder 
uberlassen bletbt. 



15. Eine Nucteotidsequenz. die aus 
einem oder mehreren nichtbenach- 
barten Abschnirten einer groGeren 
Sequenz oder aus Abschnirten ver- 
schiedener Sequenzen besteht, ist 
ais gesonderte Sequenz mit eigener 
Sequenzkennzahl zu numerieren. 
Sequenzen mit einer oder mehreren 
Lucken sind als mehrere gesonderte 
Sequenzen mit eigenen Sequenz- 
kennzahien zu numerieren, wobei die 
Zahl der gesondercen Sequenzen der 
Zahl der jeweiis zusammenhangen- 
den Sequenzdatenreihen entspricht. 



AMINOSAURESEQUENZEN 
Zu verwendende Symbole 

16. Die Aminosauren einer Protein- 
oder Peptidsequenz sind in Richtung 
von der Amino- zur Carboxyfgruppe 
von links nach rechts aufzufuhren. 
wobei die Amino- und Carboxyl- 
gruppen in der Sequenz nicht darzu- 
stellen sind. 

17. Die Aminosauren sind anhand 
des dreibuchstabigen Codes mit 
grofJem Anfangsbuchstaben ent- 
sprechend der Liste in Anhang 2, 
Tabelle 3 darzustellen. Eine Amino- 
3auT=es«qu«rtz,-die einen Leerraum 
Oder interne Termtnatorsymbole (z. B. 
"Ter", Oder ".") enthalt. ist niche 
als eine einzige Aminosauresequenz, 
sondern als getrennte Aminosaure- 
sequenzen darzustellen (s. Nr. 22). 



18. Modifizierte und seltene Amino- 
sauren sind in der Sequenz selbst wie 
die entsprechenden unmodifizierten 
Aminosauren Oder mit "Xaa" 
wtederzugeben, wenn sie zu den in 
Anhang 1, Tabelle 4 aufgefuhrten 
gehdren und die Modifikation im 
Merkmalsteil des Sequenzprotokolls 
anhand der Codes in Anhang 2, 
Tabelle 4 naher beschrieben wird. 
Oiese Codes durfen in der Beschrei- 
bung Oder im Merkmalsteil des 



U. The enumeration of the nucleo- 
tide shall start at the first base of the 
sequence with number 1. It shall be 
continuous through the whole 
sequence in the direction 5* to 3'. It 
shall be marked in the right margin, 
next to the line containing the one- 
lerter codes for the bases, and giving 
the number of the last base of that 
line. The enumeration method for 
nucleotide sequences set forth above 
remains applicable to nucleotide 
sequences that are circular in config- 
uration, with the exception that the 
designation of the first nucleotide of 
the sequence may be made at the 
option of the applicant. 



15. A nucleotide sequence that 
is made up of one or more 
non-contiguous segments of a larger 
sequence or of segments from 
different sequences shall be num- 
bered as a separate sequence, with a 
separate sequence identifier. A 
sequence with a gap or gaps shall be 
numbered as a plurality of separate 
sequences with separate sequence 
identifiers^.with the number of 
separate sequences being equal in 
number to the number of continuous 
strings of sequence data. 



AMINO ACID SEQUENCES 

Symbols to Be Used 

16. The amino acids in a protein or 
peptide sequence shall be listed in 
the amino to carboxy direction from 
left to right. The amino and carboxy 
groups shall not be represented in 
the sequence, 



17. The amino acids shall be repres- 
ented using the three-tetter code 
with the first letter as a capital and 
shall conform to the list given in 
Appendix 2, Table 3. An amino acid 
sequence that contains a blank or 
internal terminator symbols (for 
example, "Ter" or or ".") may 
not be represented as a single amino 
acid sequence, but shall be presented 
as separate amino acid sequences 
(see paragraph 22). 



18- Modified and unusual amino 
acids shall be represented as the 
corresponding unmodified amino 
acids or as "Xaa" in the sequence 
itself if the modified amino acid is 
one of those listed in Appendix 2, 
Table 4, and the modification shall be 
further described in the feature sec- 
tion of the sequence listing, using the 
codes given in Appendix 2. Table 4. 
These codes may be used in the 
description or the feature section of 



l-i, U'enumeration des nucleotides 
doit commencer par la premiere 
base de la sequence, qui portera le 
numero 1. Elle doit etre continue 
dans toute la sequence dans le sens 
5'-3'. Elle doit figurer dans la marge 
de droite sur la ligne contenant les 
codes a une lettre correspondant aux 
bases et indiquer le numero de la 
derniere base de cene ligne. La 
methode presentee ci-dessus pour 
enumerer des sequences de nucleo- 
tides s'applique aussi aux sequences 
de nucleotides de configuration 
circulaire, a cene difference pres que 
la designation du premier nucleotide 
de la sequence peut etre laissee au 
choix du depQsant. 

15. Toute sequence composee d'un 
segment ou de plusieurs segments 
non contigus d'une sequence plus 
grande ou de segments provenant 
de differentes sequences doit etre 
numerotee comme une sequence 
distincte, au moyen d'un identiftca- 
teur de sequence distinct. Une 
sequence comportant un ou des 
espaces doit etre numerotee comme 
une serie de sequences distinctes, 
au moyen d'identificateurs distincts, 
le nombre de sequences distinctes 
etant egal au nombre de chaTnes 
continues. 

SEQUENCES D'ACIDES AMINES 
Symboles a utiliser 

16. Les acides amines d'une 
sequence proteique ou peptidique 
doivent etre enumeres dans le sens 
amino-carboxy et de gauche a droite. 
Les groupes amino et carboxy ne 
doivent pas etre representes dans 

la sequence, 

17. Les acides amines doivent etre 
representes au moyen du code a 
trois lertres (la premiere lettre etant 
en majuscule), conformement a la 
liste qui figure dans le tableau 3 de 
I'appendice 2. Une sequence d'acides 
amines qui contient un espace ou 
des symboles internes de fin (par 
exemple, "Ter", ou ".") ne peut 
pas etre representee comme une 

. sequence d'acides amines unique, 
mais doit etre presentee comme une 
sequence d'acides amines distincte 
(voir le paragraphs 22). 

18- Les acides amines modifies et 
peu connus doivent etre representes 
comme les acides amines non modi- 
fies correspondants dans la sequence 
elle-meme (ou par "Xaa") si I'acide 
amine modifie figure parmi ceux qui 
sont enumeres dans le tableau 4. de 
I'appendice 2 ; la modification doit 
faire Tobjet d'une description plus 
detaillee dans la section "caracteris- 
tiques" du listage des sequences, a 
I'aide des codes enumeres dans le 
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SequenzprotokoMs, ntcht jedoch in 
der Sequenz selbst verwendet Wfjr- 
den (s. auch Nr. 32). Das Symbol 
"Xaa" steht immer nur fur eine ein- 
zige unbekannte oder modiflzieae 
Amtnosaure. 



Zu ven/vendendes Format 

19. 8ei Protein- oder Peptidsequen- 
zen sind hochstens 16 Aminosauren 
pro Zeile mit einem Leerraum zwi- 
schen den einzelnen Aminosauren 
aufzufuhren. 

20. Die den Codonen der codierenden 
Teiie einer Nucleotidsequenz entspre- 
chenden Aminosauren sind unmictei- 
bar unter den jeweiligen Codonen 
anzugeben. Wird ein Codon durch 
ein Intron aufgesp.alten, so ist das 
AminosauresymiDo! unter dem Teil 
des Codons anzugeben, der zwei 
Nucleotide enthalt. 

21. Die Zahlung der Aminosauren 
beginnt bei der ersten Aminosaure 
der Sequenz mir 1. Fakultativ konnen 
die dem reifen Protein vorausgehen- 
den Aminosauren wie beispielsweise 
Prasequenzen, Prosequenzen, Pra- 
prosequenzen und Signatsequenzen, 
soweit vorhanden, mit negativem 
Vorzeichen numeriert werden, wobei 
die Ruckwartszahlung mit der Ami- 
nosaure vor Nummer 1 beginnt. 
Null (0) wird nicht verwendet, wenn 
Aminosauren zur Abgrenzung gegen 
das reife Protein mit negativem 
Vorzeichen numeriert werden. Die 
Nummern sind im Abstand von 
jeweils 5 Aminosauren unter der 
Sequenz anzugeben. Die vorstehend 
beschriebene Zahlweise fur Amino- 
sauresequenzen gilt auch fur Amino- 
sauresequenzen mit ringformiger 
Konfiguration, wobei allerdings die 
Bestimmung der ersten Aminosaure 
der Sequenz dem Anmelder uber- 
lassen bletbt. 



22. Eine Aminosauresequenz, die aus 
einem oder mehreren nichtbenach- 
barten Abschnitten einer groGeren 
Sequenz oder aus Abschnitten ver- 
schiedener Sequenzen besteht. ist als 
gesonderte Sequenz mit eigener 
Sequenzkennzahl zu numerieren. 
Sequenzen mit einer oder mehreren 
Lucken sind als mehrere gesonderte 
Sequenzen mit ei'genen Sequenz- 
kennzahlen zu numerieren, wobei die 
Zahl der gesondeaen Sequenzen der 
Zahl der jeweils zusammenhangen- 
den Sequenzdatenreihen entspricht. 



the sequence listing but not in the 
sequence itseif (see also para- 
graph 32). The symbol "Xaa" is the 
equivalent of only one unknown or 
modified amino acid. 



Format to Be Used 

19. A protein or peptide sequence 
shall be listed with a maximum of 16 
amino acids per line, with a space 
provided between each amino acid. 



20. Amino acids corresponding to 
the codons in the coding parts of a 
nucleotide sequence shall be placed 
immediately under the correspond- 
ing codons. Where a codon is split 
by an intron, the amino acid symbol 
should be given below the portion 
of the codon containing two 
nucleotides. 

21. The enumeration of amino 
acids shall start at the first amino 
acid of the sequence, with number 1. 
Optionally, the amino acids preced- 
ing the mature protein, for example 
pre-sequences, pro-sequences, 
pre-pro-sequences and signal 
sequences, when present, may have 
negative numbers, counting back- 
wards starting with the amino acid 
next to number 1, Zero (0) is not used 
when the numbering of amino acids 
uses negative numbers to distinguish 
the mature protein. It shall be marked 
under the sequence every five amino 
acids. The enumeration method for 
amino acid sequences set forth 
above remains applicable for amino 
acid sequences that are circular in 
configuration, with the exception that 
the designation of the first amino 
acid of the sequence may be made at 
the option of the applicant. 



22. An amino acid sequence 
that is made up of one or more 
non-contiguous segments of a larger 
sequence or of segments from dif- 
ferent sequences shall be numbered 
as a separate sequence, with a 
separate sequence identifier. A 
sequence with a gap or gaps shall be 
numbered as a plurality of separate 
sequences with separate sequence 
identifiers, with the number of 
separate sequences being equal in 
number to the number of contin- 
uous strings of sequence data. 



tableau 4 de I'appendice 2. Ces code 
peuvent etre utilises dans la descrin.^ 
tion ou dans la paaie "caracteris- 
tiques" du listage des sequences 
mais pas dans la sequence propre- 
ment dite (voir aussi \e paragraphe 
32). Le symbole "Xaa" est I'equi- 
valent d'un seul acide amine inconnu 
ou modifie. 

Mode de presentation a suivre 

19. Une sequence de proteines ou de 
peptides doit qompoaer 16 acides 
amines par ligne au maximum, avec 
un espace entre chaque acide amine. 



20. Les acides amines correspondant 
aux codons dans les regions codan- 
tes d'une sequence de nucleotides 
doivent figurer immediatement 
sous les codons correspondants. 
Lorsqu'un codon est scinde par un 
intron, le symbole d'acide amine 
doit figurer sous la partie du codon 
contenant deux nucleotides. 

21. L'enumeration des acides amines 
doit commencer par le premier acide 
amine de la sequence, qui portera 

le numero 1. A titre facultatif, les 
acides amines precedant la proteine 
mature, par exemple les prese- 
quences, les prosequences et les 
pre-prosequences ainsi que les 
sequences signal lorsqu'elles 
existent, doivent porter des nombres 
negatifs et etre numerotes a rebours, 
en commengant par I'acide amine 
voisin de Tacide porcant le numero 1. 
Le numero 0 (zero) n'est pas utilise 
lorsque, dans la numerotation des 
acides amines, des valeurs negatives 
servant a distinguer la proteine 
mature. Le numero doit figurer dans 
la sequence tous les cinq acides. La 
methode presentee ci-dessus pour 
enumerer les sequences d'acides 
amines s'applique aussi aux sequen- 
ces d'acides amines de configuration 
circulaire, si ce n'est que la designa- 
tion du premier acide amine de la 
sequence peut etre laissee au choix 
du deposant. 

22. Toute sequence d'acides amines 
composee d'un segment ou de 
plusieurs segments non contigus 
d'une sequence plus grande ou de 
segments provenant de differentes 
sequences doit etre numerotee 
comme une sequence distincte, 

au moyen d'un identificateur de 
sequence distinct. Une sequence 
comportant un ou des espaces doit 
etre numerotee comme une serie 
de sequences distinctes. au moyen 
d'identificateurs de sequence dis- 
tincts, le nombre de sequences 
distinctes etant egal au nombre 
de chaines continues. 
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SOMSTIGE VERFUGBARE ANGABEN OTHER AVAILABLE INFORMATION IN AUTRES RENSEIGNEMENTS 



IM SEQUENZPROTOKOLL 



23. Die Angaben sind im Sequenzpro- 
tokoll in der Reihenfolge anzugeben. 
in der sie in der Lisce der numeri- 
schen Kennzahlen der Oacenelemence 
in Anhang 1 aufgefuhrt sind. 



2^. Fur die Angaben im Sequenz- 
prorokoll sind nur die in Anhang 1 
aufgefuhrcen numerischen Kenn- 
zahlen, nicht aber die dazugehdrigen 
Beschretbungen zu verwenden. Die 
Angaben mussen unmirteibar auf die 
numerische Kennzahl folgen; im 
Sequenzprorokoll brauchen nur die- 
jenigen numerischen Kennzahlen 
angegeben zu werden, zu denen auch 
Angaben vorltegen. Die einzigen 
beiden Ausnahmen zu dleser Vor- 
schrift bilden die numerischen Kenn- 
zahlen <220> und <300>, die fur die 
Rubrik "Merkmal" bzw. "Veroffentli- 
chungsangaben" stehen und mit den 
Angaben unterden numerischen 
Kennzahlen <221> bis <223> bzw. 
<301> bis <313> zusammenhangen. 
Werden unter diesen numerischen 
Kennzahlen im Sequenzprotokoll 
Angaben zu den Merkmalen oderzur 
Veroffentlichung gemacht. so sollte 
auch die numerische Kennzahl <220>' 
bzw. <300> aufgefuhrt, die dazuge- 
horige Rubrik aber nicht ausgefullt 
werden. Generell sollte zwischen den 
numerischen Kennzahlen eine Leer- 
zeile eingefugt werden, wenn sich 
die an erster oder zweiter Position 
der numerischen Kennzahl stehende 
Ziffer anderc. Eine Ausnahme von 
dieser allgemeinen Regel bildet die 
numerische Kennzahl <310>, der 
keine Leerzeile vorausgehen darf. 
Auch vor {eder Wiederhoiung der 
numerischen Kennzahl ist eine 
Leerzeile einzufugen. 



Qbligatonsche Datenefemente 

25. In das Sequenzprotokoll sind 
aufSerdem vor der eigentlichen 
Nucleotid- und/oder Aminosaure- 
sequenz die folgenden in Anhang 1 
definierten Angaben (obligatorische 
Datenefemente) aufzunehmen: 



<nO> Name des Anmelders 

<120> Bezeichnung der Erfindung 

<160> Anzahl der SEO ID NOs 

<2T0> SEQ ID NO: x 

<2^^> Lange 

<212> Art 

<213> Organismus 

<4.oo> Sequenz 



THE SEQUENCE LISTING 

23. The order of the items of informa- 
tion in the sequence listings shall 
follow the order in which those items 
are listed in the list of numeric 
identifiers of data elements as 
defined in Appendix 1. 



21. Only numeric identifiers of data 
elements as defined in Appendix 1 
shall be used for the presentation 
of the items of information in the 
sequence listing. The corresponding 
numeric identifier descriptions shall 
not be used. The provided informa- 
tion shall follow immediately after 
the numeric identifier while only 
those numeric identifiers for which 
information is given need appear on 
the sequence listing. Two exceptions 
to this requirement are numeric 
identifiers <220> and <300>, which 
serve as headers for "Feature" and 
"Publication Information," respec- 
tively, and are associated with 
information in numeric identifiers 
<221> to <223> and <301> to <313>, 
respectively. When feature and 
publication information is provided in 
the sequence listing under those 
numeric identifiers, numeric identi- 
fiers <220> and <30Q>; respectively,, 
should be included, but left blank. 
Generally, a blank line shall be 
inserted between numeric identifiers 
when the digit in the first or second 
position of the numeric identifier 
changes. An exception to this gen- 
eral rule is that no blank line should 
appear preceding numeric identi- 
fier <310>. Additionally, a blank line 
shall precede any repeated numeric 
identifier. 



Mandatory Data Elements 

25. The sequence listing shall 
include, in addition to and immedi-. 
ately preceding the actual nucleotide 
and/or amino acid sequence, the 
following items of information 
defined in Appendix t (mandatory 
data elements): 

<nO> Applicant name 
<120> Title of invention 
<160> Number of SEQ ID NOs 
<210> SEQ ID NO: x 
<211> Length 
<212> Type 
<213> Organism. 
<400> Sequence 



DEVANT FIGURER DANS LE LlSTAr- 
OES SEQUENCES 

23. L'ordre des elements d'informa- 
tion dans le Itstage des sequences 
doit suivre l'ordre dans lequel ces 
elements sont enumeres dans la liste 
des identificateurs numeriques des 
elements de donnees definis a 
Tappendice 1. 

24.. Seuls les identificateurs nume- 
riques des elements de donnees 
definis a I'appendice 1 peuvent etre 
utilises aux fins de la presentation 
des elements d'information figurant 
dans ie listage des sequences. Les 
descriptions correspondantes des 
identificateurs numeriques ne doi- 
vent pas etre utiiisess. Les renseigne- 
ments communiques doivent suivre 
immediatement I'identificateur 
numerique et seuls les identificateurs 
numeriques pour lesquels des 
renseignements sont communiques 
doivent figurer dans le listage des 
sequences. Font exception a certe 
regie les identificateurs numeriques 
<22d> et <300>, qui sen/ent d'en-tete 
aux elements "caracteristique" et 
"informations concernant la publi- 
cation". et sont associes a I'informa- 
tion figurant sous les identificateurs 
numeriques <221> a <223> et <301> a 
<313>, respectivement. Lorsque, sous 
ces identificateurs numeriques, des 
indications concernant les elements 
"caracteristique" et "informations 
concernant la publication" sont four- 
nies dans le listage des sequences, il 
convient d'inclure les identificateurs 
numeriques <220> et <300> en les 
laissant en blanc. En general, une 
ligne vierge dott etre inseree entre les 
identificateurs numeriques lorsque ie 
chiffre venant en premiere ou en 
deuxieme position dans ces identifi- 
cateurs change. Toutefois, aucune 
ligne vierge ne doit preceder Tidenti- 
ficateur numerique <310>. De plus, 
une ligne vierge doit preceder tout 
identificateur numerique repete. 

Elements de donnees abligatoires 

25. Le listage des sequences doit 
contenir, en sus de la sequence de 
nucleotides ou d'acides amines 
proprement dite et juste avant 
calle-ci, les elements d'information 
ci-apres definis a I'appendice 1 
{elements de donnees obligatoires) : 

<1 10> Nom du deposant 

<120> Titre de I'invention 

<160> Nombre de SEQ ID NO 

<210> SEQ 10 NO : x 

<211> Longueur 

<212> Type 

<213> Organisme 

<'tOO> Sequence 
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(s: der Name des Anmetders (nume- 
nsche Kennzahl <no>) nicht in Buch- 
staben des lateinischen Alphabets 
geschrieben, so ist er - im Wege der 
Transliteration oder der Uberseizung 
tns Englische - auch in (ateinischen 
BuchsTaben anzugeben. 



Die Oatenelemente mit Ausnahme 
der Angaben unter den numerischen 
Kennzahlen <1 10>, <120> und <160> 
sind furjede inn Sequenzprotokoii 
aufgefuhrte Sequenz zu wiederholen 
Gibt es zu einer Sequenzkennzahl 
keine Sequenz, so mQssen nur die 
Oatenelemente unter den numeri- 
schen Kennzahlen <210> und «100> 
angegeben werden (s. Nr. 5 und S£Q 
ID NO: 4 in dem in Anhang 3 dieses 
Standards enthaltenen Beispiel). 



26. In Sequenzprotokolle, die zusam- 
men mit der dazugehorigen Anmei- 
dung Oder vor Vergabe einer Anmel- 
dungsnummer eingereicht werden, 
ist neben den unter Nummer 25 
genannten Datenelementen auch 
das foigende aufzunehmen: 



<130> Aktenzeichen 

27. In Sequenzprotokolle, die auf Auf- 
forderung einer zustandigen Behorde 
Oder nach Vergabe einer Anmel- 
dungsnummer eingereicht werden, 
smd neben den unter Nummer 25 ' 
genannten Datenelementen auch die 
folgenden aufzunehmen; 



<U0> Vodiegende Patentanmeldung 
<U1> Anmeldetag der vorliegenden 
Anmeldung 

28. In Sequenzprotokolle, die zu einer 
Anmeldung eingereicht werden, die 
di<PriorTtat«inerfruheren Anmel- 
dung m Anspruch nimmt, sind neben 
den unter Nummer 25 genannten 
Datenelementen auch die folgenden 
aufzunehmen: 



Where the name of the applicant 
(numeric tdentifier <no>) is wrinen 
<n characters other than those of the 
Latin alphabet, it shall also be indi- 
cated in characters of the Latin alpha- 
bet either as a mere transliteration or 
through translation into English. 

The data elements, except those 
under numeric identifiers <nO>, 
<120> and <760>, shall be repeated 
for each sequence included in the 
sequence fisting. Only the data ele- 
ments under numeric identifiers 
<210> and <400> are mandatory if no 
sequence is present for a sequence 
tdentifier (see paragraph 5, above 
and SEQ ID NO: 4 in the example 
depicted in Appendix 3 of this 
Standard). • 
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26. In addition to the data elements 
identified in paragraph 25, above, 
when a sequence listing is filed at the 
same time as the application to 
which it pertains or at any time prior 
to the assignment of an application 
number, the following data element 
shall be included in the sequence 
listing: 



<130> File reference 

27. In addition to the data elements 
identified in paragraph 25, above, 
when a sequence listing is filed in 
response to a request from a 
competent Authority or at any time 
following the assignment of an 
application number, the following 
data elements shall be included in 
the sequence listing: 

<140> Current patent application 
<141> Current filing date 



<150> Fruhere Patentanmeldung 

<151> Anmeldetag der fruheren 
Anmeldung 



28. In addition to the data elements 
identified in paragraph 25, above, 
wf>en a sequence listing is filed 
relating to an application which 
claims the priority of an earlier 
application, the following data 
elements shall be included in the 
sequence listing: 

<150> Earlier patent application 
<^S^> Earlier application filing date 



Lorsque le nom du deposant (identi 
ficateur numenque <110>) est ecrir 
dans des caracteres qui ne sont nL 
ceux de ('alphabet latin, il convieru 
I ecrire aussi a I'aide de cet alphabet 
sous la forme d'une simple translit- 
teration ou d'une traduction en 
anglais. 

Tous les elements de donnees, a 
I'exceptton de ceux qui figurent sous 
les identificateurs numeriques <no^ 
<120> et <160>, doivent etre repetes ' 
pour chaque sequence figurant dans 
le listage des sequences. Seuls sont 
obligatoires les elements de donnees 
figurant sous les identificateurs 
numeriques <210> et <400> lors- 
qu'aucune sequence n'est associee 
a un identificateur de sequence (voir 
le paragraphe 5 ci-dessus et la 
sequence SEQ ID NO 4 dans I'exem- 
ple donne a I'appendice 3 de la pre- 
sente norme). 

26, Outre les elements de donnees 
indiques au paragraphe 25, lorsqu'un 
listage des sequences est depose 
en meme temps que la demande 
a laquelle il se rapporte ou a un 
moment quelconque avant I'anribu- 
tiofi d'un numero de demande, 
I'element de donnee ci-apres doit 
etre incius dans le listage des 
sequences : 

<130> Reference du dossier 

27. Outre les elements de donnees 
enumeres au paragraphe 25, lors- 
qu'un listage des sequences est 
depose sur requete d'une administra- 
tion competente ou a un moment 
quelconque apres I'attribution d'un 
numero de demande, les elements de 
donnees ci-apres doivent etre incius 
dans le listage des sequences : 

<U0> Demande de brevet acTuelle 
<U1> Date de depot de la demande 
actuefle 

23. Outre les elements de donnees 
indiques au paragraphe 25, lorsqu'un 
listage des sequences est depose en 
relation avec une demande dans 
laquelle une priorite est revendiquee, 
les elements de donnees ci-apres 
doivent etre incius dans le listage des 
sequences : 

<150> Demande de brevet ante- 
rieure 

<151> Date de depot de la demande 
anterieure 
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29. Wird in der Sequenz "n", "Xaa" 
Oder eine modifizierre Base Oder 
modifizierce/seltene L-Aminosaure 
aufgefuhrc. so mussen die folgenden 
Oacenelemente angegeben warden: 

<220> Merkmal 

<221> Nanne/Schiussel 

<222> Lage 

<223> Sonstige Informationen 

30. Is: der Organismus (numerische 
Kennzahl <213>) eine "kiinsTliche 
Sequenz" Oder "unbekannt", so mus- 
sen die folgenden Oatenelemente 
angegeben werden: 

<220> Merkmal 

<223> Sonstige Angaben 

Fakultative Dacenefemence 

31. Alle in Anhang 1 deflnierten 
Oatenelemente. die unterden 
Nummern 25 bis 30 nicht erwahnt 
sind, sind fakultativ (fakultative 
Oatenelemente). 

Angabe von Merkmalen 

32. Merkmale, die (unter der numeri- 
schen Kennzahl <220>) zu einer 
Sequenz angegeben werden, sind 
durch die in Anhang 2,.Tabellen 5 
und 6' aufgefuhrten "Merkmal- 
schlusse!" zu beschreiben. 

Freier Text 

33. Unter "freiem Text" ist eine ver- 
bale Beschreibung der Eigenschaften 
der Sequenz ohne Verwendung des 
sprachneutralen Vokabulars im Sinne 
der Nummer 2 yii) unter der numeri- 
schen Kennzahl <223> {Sonstige 
Angaben) zu verstehen. 



34.. Der freie Text sollte stch auf 
einige kurze, fur das Verstandnis der 
Sequenz unbedingt norwendige 
Begriffe beschranken. 6r soilte in 
engiischer Sprachfi fur jedes Oaten- 
element nlcht linger ais 4 Zeilen sein 
und hochstens 65 Buchstaben pro 
Zeile umfassen. Alle weiteren Anga- 
ben sind in den Hauprteil der 
Beschreibung in der dort verwen- 
deten Sprache aufzunehmen. 

35. Freier Text sollte tn engiischer 
Sprache abgefaSt sein. 

36. Enthalt das Sequenzprotokoll, das 
Bestandteil der Beschreibung ist, 
freien Text, so ist dieser im Haupneil 
der Beschreibung in der dort verv/en- 



Oimsm r4b«llen •nthatcon AuszOga aus dsn M«rkmals- 
t^oallan *003J/EMBUG«nBank P«atur« Tjbta' 
(Nucl«otid4aqu«nsanl und 'SWrSS PRQT Faatura 
TjOU" (AminosiurasaQuanzan). 



29. If "n" or "Xaa" or a modified 
base or modified/unusual L-amino 
acid is used in the sequence, the 
following data elements are 
mandatory: 

<220> Feature 

<221> Name/key 

<222> Location 

<223> Other information 

30. If the organism (numeric identi- 
fier <213>) is "Artificial Sequence" 
or "Unknown," the following data 
elements are mandatory: 



<220> Feature 

<223> Other information 

Opcionai Data Elements 

31, All data elements defined in 
Appendix 1, not mentioned in 
paragraphs 25 to 30. above, are 
optional (optional data elements). 



Presentation of Features 

32. When features of sequences are 
presented (that is, numeric identifier 
<220>), they shall be described by the 
"feature keys" set out in Appendix 2, 
Tables 5 and 6.^ 



Free Text 

33. "Free text" is a wording describ- 
ing charactei'istics of the sequence 
under numeric identifier <223> (Other 
information) which does not use 
language-neutral vocabulary as 
referred to in paragraph 2(vii). 



34. The use of free text shall be 
limited to a few short terms indis- 
pensable for the understanding of 
the sequence. It shall not exceed four 
lines with a maximum of 65 charac- 
ters per line for each given data 
element, when written in English- 
Any further information shall be 
included in the main part of the 
description in the language thereof. 



35. Any free text should preferably be 
in the English language. 

36. Where the sequence listing part 
of the description contains free text, 
any such free text shall be repeated 
in the main paa of the description in 



' Thasa cabtas contain axtraas af tha OOSJ/EMBL/ 
Canaank Faatura Tjbla (nucl«attda s*cuancas> 
and ma SWISS PROT f^aturm TabU (amino acid 
saquancasl. 



29. Lorsque "n", "Xaa". une base 
modifiee ou un acide amine L 
modifie ou peu connu est utilise dans 
la sequence, les elements de 
donnees ci-apres doivent etre inclus : 

<220> Caracteristique 

<221> Nom/cle 

<222> Emplacement 

<223> Autres informations 

30. Lorsque I'organisme (identifica- 
teur numerique <213>) est une 
"sequence artificielle" ou qu'il est 
"inconnu", les elements de donnees 
ci-apres doivent etre inclus : 

<220> Caracteristique 
<223> Autres informations 

Elements de donnees facultatifs 

31 . Tous les elements de donnees 
definis a I'appendice 1 qui ne sont 
pas mentionnes dans les para- 
graphes 25 a 30 sont facultatifs 
(elements de donnees facultatifs). 

Presentation des caracteristiques 

32. Les caracteristiques des sequen- 
ces (identificateur numerique <220>) 
doivent etre decrites a I'aide des 
"cles de caracterisation" indiquees 
dans les tableaux 5 et 6 de I'appen- 
dice 2\ 

Texte litre 

33. Par "texte Itbre" on entend la 
description des caracteristiques 
d'une sequence dans le cadre de 
ridentificateur numerique 223 (autres 
informations) a I'aide d'un vocabu- 
laire qui ne fait pas partie du vocabu- 
laire non connote denni au para- 
graphe 2)vii). 

34. Le texte libre doit se limiter a 
quelques termes brefs indispensa- 
bles a la comprehension de la 
sequence. II ne doit pas exceder 
quatre lignes, avec un maximum de 
65 caracteres par ligne, pour chaque 
element de donnees lorsqu'il est ecrit 
en anglais. Toute autre information 
doit figurer dans la partie principale 
de la description dans la langue de 
ce!te-ci. 

35. Le texte libre doit, de preference, 
etre redige en anglais. 

36. Lorsque, dans la description, 
la partie reservee au listage des . 
sequences contient du texte libre, 
celui-ci doit etre repete dans la partie 



Cas tablaaux conciannanc das anraits du 00BJ/£M8L/ 
GenBank Fttatura Tabia (saquancas da nuclaotidasi 
at du tableau da caractarixtiquas SWISS PROT 
(soQuoncos d'acidas aminaa). 
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deien Sprache zu wiederholen. £5 
wird empfohlen. den in der Sprache 
des Haupneils der Beschreibung 
abgefafiten freien Text in einen 
besonderen Abschnirt der Beschrei- 
bung mit der Uberschrift "Sequenz- 
protokoll - freier Text" aufzunehmen. 

NACHGEHEICHTES 
SEQUEN2PR0T0K0LL 

37. Aile Sequenzprotokolle, die nicht 
zusamnnen mit der Annneldung, 
sondern sparer eingereicht werden, 
durfen nicht uber den Offenbarungs- 
gehalt der Anmeldung in der einge- 
reichten Fassung hinausgehen; ihnen 
ist etne entsprechende Erklarung 
beizufugen. Die zur Anmeldung nach- 
gereichten Sequenzprotokolle durfen 
also nur die Sequenzen enthalten, die 
in der Anmeldung in der eingereich- 
ten Fassung offenbarc worden sind. 

33. Sequenzprotokolle, die nicht 
zusammen mit der Anmeldung 
eingereicht worden sind, sind nicht 
Bestandteil der Anmeldung. Da die 
Regein ly. 26.3 und 91 sowie der 
Artiket 34. PCT Anwendung finden, 
besteht jedoch - vorbehaltlich der 
einschlagigen Bestimmungen - die 
Mogiichkeit, Sequenzprotokolle, die 
zusammen mit der Anmeldung ein- 
gereicht wurden, im Wege der 
Mangeibeseitigung gemaS Regel 
13'" Oder 26.3 PCT und - bei Vorlie- 
gen offensichtlicher Fehier - gemaS 
Regel 91 PCT zu berichtigen oder 
gemaG Artikel 34 PCT zu andern 
sowie ferner im Wege der Anderung 
der Anmeldung gemaS Artikel 34. 
PCT ein Sequenzprotokoll nach- 
zureichen. 



SEQUENZPROTOKOLL IN 
MASCHINENLESBARER FORM 



39. Das in der Anmeldung enthaltene 
SequenzproxokoJJ ist zusatzJich auch 
in maschinenlesbarer Form ein- 
zureichen, wenn die zustandige 
Behorde dies verlangt. 

40. Das zusatzlich eingereichte . 
maschinenlesbare Sequenzprotokoll 
mul3 rriit dem geschriebenen Proto- 
koll identisch sein und ist zusammen 
mit einer Erklarung folgenden Won- 
lauts einzureichen: "Die in maschi- 
nenlesbarer Form aufgezeichneten 
Angaben sind mit dem geschrie- 
benen Sequenzprotokoll identisch." 
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the language thereof. It is recom- 
mended that the free text in the 
language of the main part of the 
description be put in a specific 
section of the description called 
"Sequence Listing Free Text." 



SUBSEQUENTLY FURNISHED 
SEQUENCE LISTING 

37. Any sequence listing which is not 
contained in the application as filed 
but which is furnished subsequently 
shall not go beyond the disclosure in 
the application as filed and shall be 
accompanied by a statement to that 
effect. This means that a sequence 
listing furnished subsequently to the 
filing of the application shall contain 
only those sequences that were 
disclosed in the application as filed. 



33- Any sequence listing not con- 
tained in the application as filed does 
not form part of the application. How- 
ever, the provisions of PCT Rules 
13'", 25.3 and 91 and PCT Anicle 34 
would apply, so that it may be 
possible, subject to the applicable 
provisions, for a sequence listing 
contained in the application as filed 
to be corrected under PCT Rules 
^y•'Q^ 26.3, rectified under PCT 
Rule 91 (in the case of an obvious 
error), or amended under PCT Article 
34, or for a sequence listing to be 
submined under PCT Article 34 as an 
amendment to the application. 



COMPUTER READABLE FORM OF 
THE SEQUENCE LISTING 



39. A copy of the sequence listing 
shall also be submitted in computer 
readable form, in addition to the 
sequence listing as contained in the 
application; whenever this is required 
by the competent Authority, 

40. Any sequence listing in computer 
readable form submined in addition 
to the written sequence listing shall 
be identical to the written sequence 
listing and shall be accompanied by 
a statement that "the information 
recorded in computer readable form 
is identical to the written sequence 
listing." 



prmcipale de la descriprion. dans la 
meme langue. II est recommande 
que le texte libre figurant dans la 
partie principale de la description soit 
insere dans une rubrique parciculiere 
de la description intitulee "texte libre 
du listage des sequences". 

LISTAGE DES SEQUENCES DEPOSE 
ULTERIEUREMENT 

37. Tout listage des sequences qui 
ne figure pas dans la demande telle 
qu'elle a ete deposee et qui est remis 
ulterieurement ne doit pas contenir 
d'elements allant au-dela de la 
divulgation faite dans ladite demande 
et doit etre accompagne d'une decla- 
ration a cet effet. Autrement dit, un 
listage des sequences remis apres le 
depot de la demande ne doit contenir 
que les sequences qui ont ete divul- 
guees dans la demande en question. 

33. Tout listage des sequences ne 
figurant pas dans la demande telle 
qu'elle a ete deposee ne fait pas 
partie de la demande. Toutefois, les 
dispositions des regies 13'»', 26.3 et 
91 du reglement d'execution du PCT 
et celles de I'article 34 du PCT s'appli- 
quent normalement, de telle sorte 
qu'il est possible, sous reserve des 
dispositions applicables, qu'un 
listage des sequences figurant dans 
la demande telle qu'elle a ete depo- 
see fasse I'objet d'une correction en 
vertu de la regie 13*" ou 26.3 du 
reglement d'execution du PCT, d'une 
rectification en vertu de la regie 91 
du reglement d'execution du PCT 
(dans le cas d'une erreur evidente) 
ou d'une modification en vertu de 
I'article 34 du PCT, ou qu'un listage 
des sequences soit soumis en vertu 
, de I'article 34 du PCT a titre de modi- 
fication de la demande. 

LISTAGE DES SEQUENCES SOUS 
UNE FORME DECHIFFRABLE PAR 
ORDINATEUR 

39. Outre le listage des sequences 
figurant dans la demande, une copie 
de ce meme listage doit etre fournie 
sous une forme dechiffrable par ordi- 
nateur chaque fois que I'administra- 
tion competente I'exige. 

40. Tout listage des sequences sous 
une forme dechiffrable par ordinateur 
qui est remis en sus du listage des 
sequences presente par ecrit doit etre 
identique a ce dernier et etre accom- 
pagne de la declaration suivante : 
"les informations enregistrees sous 
une forme dechiffrable par ordinateur 
sont identiques a celles du listage 
des sequences presente par ecrit." 
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Oas gesamte ausdruckbare 
Exemplar des SequenzprorokoMs 
mufi in einer einzigen Oatei enthaiten 
sein, die nach Mdglichkeit auf einer 
einzigen Oiskene oder einem sonsti- 
gen von der rustandigen Behdrde 
akieptierteo elektronischen Daten- 
crager aufgezeichnet sein soil. Oiese 
Oacei ist minets der IBM^ -Codetabel- 
len (Code Page) 437, 932^ oder einer 
kompatiblen Coderabelle zu codieren. 
£ine Codetabelle. wie sie z. B. fur 
japanische, chinesische, kyrilHsche, 
arabische, griechische oder hebrai- 
sche Schriftzeichen benotigt wird, 
giic als kompatibei, wenn sie das 
laceinische Alphabet und die arabi- 
schen Ziffern denselben Hexadezi- 
malposicionen zuordnetwre die 
genannten Codetabellen. 



42. Die maschinenlesbare Fassung 
solt mit spezieiler Software wie 
Patenrin oder anderen kundenspezifi- 
schen Computerprogrammen erstellt 
werden; sie kann mit beliebigen 
Mineln erstellt werden, solange das 
Sequenzprotokoil auf einer Diskette 
Oder einem anderen von der zustan- 
digen Behorde akzepciercen elek- 
tronischen Trager eingereicht wird - 
und mit einem Betriebssystem fur 
Personal Computer gelesen werden 
kann, das von der zustandigen 
Behorde akzeptiert wird. 

43. Bei Verwendung von Disketten 
ist eine Datenkompression eriaubt, 
so fern die komprimierte Datei in 
einem selbstexxrahierenden Fomat 
erstellt worden ist, das sich auf 
einem von der zustandigen Behdrde 
akzeptieaen Betriebssystem fur 
Personal Computer seibst dekom- 
primiert. 

44. Auf der Diskette oder einem ande- 
ren von der zustandigen Behorde 
akzeptieaen elektronischen Trager ist 
ein Etikea fest anzubringen, auf dem 
von Hand oder mit der Maschine in 
SlocJcschrift der Name des Anmel- 
ders, die Bezeichnung der Erfindung, 
ein Aktenzeichen, der Zeitpunkt der 
Aufzeichnung der Oaten, das Compu- 
terbecriebssystem und der Name der 
zustandigen Behorde eingetragen 
sind. 



45. Wird die Diskette oder ein ande* 
res von der zustandigen Behorde 
akzepcieaes elektronisches Medium 
erst nach dem Tag der Anmeldung 



41. The entire printable copy of the 
sequence listing shall be contained 
within one electronic file preferably 
on a single diskette or any other 
electronic medium that is acceptable 
to the competent Authority. The file 
recorded on the diskette or any other 
electronic medium that is acceptable 
to the competent Authority shall be 
encoded using IBM* Code Page 437, 
IBM Code Page 932^ or a compatible 
code page. A compatible code 
page, as would be required for, for 
example. Japanese, Chinese, Cyrillic, 
Arabic, Greek or Hebrew characters, 
is one that assigns the Roman alpha- 
bet and numerals to the same hexa- 
decimal positions as do the specified 
code pages. 



42. The computer readable form shall 
preferably be created by dedicated 
software such as Patentin or other 
custom computer programs; it may 
be created by any means, as long as 
the sequence listing on a submitted 
diskene or any other electronic 
medium that is acceptable to the 
competent Authority is readable 
under a Personal Computer Operat- 
ing system that is acceptable to the 
competent Authority, 



43. File compression is acceptable 
when using diskene media, so long 
as the compressed file is in a self- 
extracting format that will decom- 
press on a Personal Computer 
Operating system that is acceptable 
to the competent Authority. 



44. The diskene or any other elec- » 
tronic medium that is acceptable to 
the competent Authority shall have a 
label permanently affixed thereto on 
which has been hand-printed, in 
block capitals or typed, the name of 
the applicant, the title of the inven- 
tion, a reference number, the date on 
which the data were recorded, the 
computer operating system and the 
name of the competent Authority. 



45. If the diskette or any other elec- 
tronic medium that is acceptable to 
the competent Authority is submitted 
after the date of filing of an applrca- 



41. La copie imprimable du lisTage 
des sequences doit, de preference, 
figurer tout entrere dans un seul 
fichier electronique sur une seule 
disquene ou sur tout autre suppoa 
electronique admis par I'administra- 
tion competente, Le fichier enregistre 
sur la disquene ou sur tout autre 
support electronique admis par 
I'administration competente doit etre 
code selon la page de code IBM= 437, 
la page de code IBM 932^ ou une 
page de code compatible. Une page 
de code compatible (requise pour les 
caracteres japonais, chinois, cyril- 
liques, arabes. grecs. hebraTques, 
etc.) est une page de code qui anri- 
bue les lenres de I'alphabet romain 
ec les chiffres aux memes positions 
hexadecimales que les pages de code 
indiquees. 

42. Le listage dechiffrable par ordina- 
teur doit, de preference, etre cree par 
un logiciel specialise te! que Patentin 
ou d'autres programmes informa- 
tiques personnaiises ; il peut etre cree 
par tout autre moyen dans la mesure 
ou le listage des sequences figurant 
sur ta disquene ou sur tout autre sup- 
port electronique admis par I'admi- 
nistration competente est dechiffra- 
ble sous un systeme d'exploitation 
d'ordinateur individuel lui aussi 
admis par I'administration compe- 
tente. 

43. La compression d'un fichier est 
admise lorsque le support est une 
disquene, dans la mesure ou le 
fichier compresse se presente sous 
un format auto-extractible qui se 
decomprimera sur un systeme d'ex- 
ploitation d'ordinateur personnel 
admis par I'administration compe- 
tente. 

44. Sur la disquene ou sur tout autre 
support electronique admis par I'ad- 
ministration competente doit etre 
apposee une etiquene fixe portant 
les indications manuscrites ten 
majuscules d'imprimerie) ou dacty- 
lographiees suivantes : le nom du 
deposant, le titre de I'invention, un 
numero de reference, la date a 
laquelle les donnees ont ete enregis- 
trees, le systeme d'exploitation 
informatique et le nom de I'adminis- 
tration competente. 

45. Si la disquene ou tout autre 
support electronique admis par 
I'administration competente est 
fournie apres la date de depot de la 



* IBM i*t 9in* fur dt« Intamattonal 3usin«sa Macnina 
CarDoranan, V«rfltnigTo Scaaton von Amarika. 
singairagan* Hantfalsmarka. 

* 0«« gonannton CodeUDaitan g«lt»n fur P»rtonal 
Computar praiaiscn als Standard. 



' IBM i% a ragistftr»d tradamart at Intarnational 
Buiinass Macnin« Corooration. Unitad Statas of 
Amartca. 

' Tha sosciHad coda pagas jre d* /aero itan cards tor 
parvinal compucars. 



' IBM «it una marque onregistraa de la xocieia 
International Sustnass Machines, des eiats-Unis 
d'Amarjgua. 

' Uei pages ds code rnencionna«s consiituem des 
norm as /acro pour (as ordinateurs personnels. 
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eingereichr. so sind auf den Etikerten 
auch der Anmeldetag und die 
Anmeldungsnummer anzugeben. 

46. Jeder Berichtigung des geschrie- 
benen Sequenzprotokolls n'ach Regel 
T3^-M (a) i) Oder 26.3 PCT, jeder 
Berichtigung eines offensichtlichen 
Fehlers im geschriebenen Sequenz- 
protokoll nach Regel 91 PCT und 
jeder nach Artike! 34 PCT vorgenom- 
menen Anderung. die sich auf ein 
geschriebenes Sequenzprotokoll 
bezieht, ist ein maschinenlesbares 
Sequenzprotokoll beizufugen, in dem 
diese Berichtigung Oder Anderung 
berucksichtigt worden ist. 



tion, the labels shall also include the 
filing date of the application and the 
application number. 

4-6. Any correction of the written 
sequence listing which is submined 
under PCT Rules 13**Mia)(i) or 26.3. 
any rectification of an obvious error 
in the written sequence listing which 
is subnnined under PCT Rule 91, or 
any amendment which includes a 
written sequence listing and which is 
submitted under PCT Article 34, shall 
be accompanied by a computer read- 
able form of the sequence listing 
including any such correction, recti- 
fication or amendment. 



demande, cene date et le numero de 
!a demande doivent aussi figurer sur 
les etiquettes. 

46. Toute correction - en veau des 
regies 13*»M.a)i) ou 26.3 du regle- 
ment d'execution du PCT-du listage 
des sequences presente par ecrit, 
toute rectification - en vercu de la 
regie 91 du reglement d'execution du 
PCT - d'une erreur evidente dans le 
listage des sequences presente par 
ecrit ou toute modification - en vertu 
de Tarticle 34. du PCT - qui comprend 
un listage des sequences presente 
par ecrit doit etre accompagnee du 
listage des sequences sous une 
forme dechiffrable par ordinateur. 
comprenant la correction, la rectifi- 
cation ou la modification en question. 
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Anhang 1 

Numerische Kennzahlen 

In Sequenzprotokolien, die zu Anmel- 
dungen eingeretcht werden. durfen 
nur die nachstehenden numerischen 
Kennzahlen verwendet werden. Die 
Uberschriften der nachstehenden 
Darenelemenrrubriken durfen in den 
SequenzprotokoMen nichr erscheinen. 



Die numerischen Kennzahlen der 
obtigatorischen Datenelennente. d. h. 
der Datenelemente, die in alle 
Sequenzprotokolle aufgenonnmen 
werden mOssen (s. Nr. 25 dieses 
Scandards: Kennziffern 110, 120. 160. 
210, 211. 212, 213 und 400). und die 
numerischen Kennzahlen der Oaten- 
elemente. die in den in diesem 
Standard genannten Fallen aufge- 
nommen werden mussen (s. Nr. 25, 



27, 23. 29 und 30 dieses Standards- 
Kennzahlen 130. 140. 14i. 150 und" 
151 sowie 220 bis 223). sind mit dem 
Buchstaben "O" gekennzeichnet. 

Die numerischen Kennzahlen der 
fakultativen Datenelemenre (s. Nr. 3i 
dieses Scandards) sind mit dem 
Buchstaben "F" gekennzeichnet. 



Numerische 
Kennzahl 


Numerische Kennzahl 
Beschreibung 


Obligatorisch (O) Oder 
fakultativ (R 


Bemerkungen 


<110> 


Name des Anmeldars 


0 


1st der Name des Anmelders nicht in 
lateinischen Buchstaben geschrieben, 
so muS er - im Wege der Transiiteration 
Oder der Obersetzung ins Engiische - 
auch in lateinischen Buchstaben 
angegeben werden. 


<120> 


Bezeichnung der Emndung 


O 




<130> 


Aktenzeichen 


0 in den Fallen 
nach Nr. 26 Standard 


Siehe Nr. 25 Standard. 


<140> 


Voriiegende Patentanmeldung 


0 in den Fallen 
nach Nr. 27 Standard 


Siehe Nr. 27 Standard; die voriiegende 
Patentanmeldung ist zu kennzeichnen 
durch den zweibuchsrabigen Code nach 
dem WIPO-Standard ST. 3, gefolgt von 
der Anmeldungsnummer (in dem For- 
mat, das von der Behorde fur gewerbli- 
chen Rechtsschutz verwendet wird, bei 
der diese Patentanmeldung eingereicht 
. wird) Oder - bei internationalen Anmel- 
dungen — von der internationalen 
Anmeldungsnummer. 


<141> 


Anmeldetag der 
vorliegenden Anmeldung 


O in den Fallen 
nach Nr. 27 Standard 


Siehe Nr. 27 Standard; das Datum ist 
entsprechend dem WIPO-Standard ST. 2 
anzugeben (CCYY MM DO). 


<150> 


Fruhere Patentanmeldung 


0 in den Fallen 
nach Nr. 28 Standard 


Siehe Nr. 28 Standard; die fruhere 
Patentanmeidu no ist tu kenn7eichn**n 
durch den zweibuchstabigen Code ent- 
sprechend dem WIPO-Standard ST. 3, 
aefolot von der Anmelduna^numnnpr 
(in dem Format, das von der Behorde 
fur gewerblichen Rechtsschutz verwen- 
det wird. bei der die fnihprp Parpnf- 
anmeldung eingereicht wurde) oder- 
bei internationalen Anmeldungen - 
von der internationalen Anmeldungs- 
nummer. 


<151> 


Anmeldetag der 
fruheren Anmeldung 


0 in den Fallen 
nach Nr. 28 Standard 


Siehe Nr. 28 Standard; das Datum ist 
entsprechend dem WIPO-Standard ST. 2 
anzugeben (CCYY MM DO). 


<160> 


Anzahl der SEQ tO NOs 


0 




<170> 


Software ' 


F 




<210> 


Angaben zu SEQ 10 NO: x 


0 


Anzugeben ist eine ganze Zahl, die die 
SEQ ID NO darstellt. 


<2n> 


Lange 


0 


Sequenzlange, ausgedruckt als Anzahl 
der Basenpaare Oder Aminosauren 


<212> 


Art 


O 


Art des in SEQ ID NO: x sequenzierten 
Molekuls, und zwar encweder DNA, RNA 
Oder PRT; enthalteine Nucleotidsequenz 
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sowohj DNA- als auch RNA-Fragmente 
so ist "DNA" anzugeben; zusatzlich ist ' 
das kombinierte DNA-/RNA-Molekul im 
Merkmalsteil unter <220> bis <223> 
naherzu beschreiben. 


<213> 


Organismus 


0 


Gartung/An (d. h, wissenschaftlicher 
Name), "kunstliche Sequenz" oder 
"unbekannt" 


<220> 


Merkmal 


0 in den Fallen hach 
Nr. 29 und 30 Standard 


Freilassen; siehe Nr. 29 und 30 Stan- 
dard; Beschreibung biologisch signifi- 
kanter Stellen in der Sequenz gemaS 
ScQ ID NO: X) (kann je nach der Zahl 
der angegebenen Merkmaie mehrmais 
vorkommen). 


<221> 


Name/Schiussei 


0 in den Fallen 

nach Nr. 29 Standard 


Siehe Nr. 29 Standard; es durfen nur die 
in Anhang 2, Tabelle 5 Oder 6 beschrie- 
benen Schiussel verwendet werden. 


<222> 


Lage 


0 in den Fallen 

nach Nr. 29 Standard 


Siehe Nr. 29 Standard; 

- von (Nummer der ersten Base/Amino- 
saure des Merkmals) 

- bis (Nummer der ietzten Base/Amino- 
saure des Merkmals) 

- Basenpaare (Ziffern venA/eisen auf 
die Positionen der Basenpaare in einer 
Nucleotidsequenz) 

- Aminosauren (Ziffern ven^eisen auf 
die Positionen der Aminosaurereste in 
einer Aminosauresequenz) 

- Angabe, ob sich das Merkmal auf dem 
zum Strang des Sequenzprotokolls 
komplementaren Strang befindet 


<223> 


Sonstige Angaben 


0 in den Fallen nach 
Nr. 29 und 30 Standard 


Siehe Nr. 29 und 30 Standard; sonstige 
relevante Angaben, wobei sprachneu- 
trales Vokabular oder freierText (mog- 
lichst in engiischer Sprache) zu verwen- 
den ist; freier Text ist im Hauptteil der 
Beschreibung in der dort verwendeten 
Sprache zu wiederholen (s. Nr. 36 
Standard); enthait die Sequenz eine der 
in Anhang 2, Tabellen 2 und 4. aufgefuhr- 
ten modifizierten Basen oder modifizier- 
ten/seitenen L-Aminosauren, so ist fur 
diese Base oder Aminosaure das dazu- 
gehorige Symbol aus Anhang 2, 
Tabellen 2 und 4. zu ven^enden. 


<300> 


Veroffentlichungsangaben 


F 


Freilassen; dieser Afaschnin ist fur 
jede relevante Veroffentiichung zu 
wiederholen. 


<301> 


Verfasser 


F 






Tirei 


F 


Titel der Veroffentiichung 


<303> 


Zeitschrift 


F 


Name der Zeitschrift. in der die Daten 

vci uiici iLiiwiiL w u ( u cf n 


<304> 


Band 


F 


Band der Zeitschrift, in dem die Daten 
veroffentlicht wurden 


<305> 




F 


Nummer des Hefts der Zeitschrift, in 
dem die Daten veroffentlicht wurden 


<306> 


Seiten 


F 


Seiten der Zeitschrift, auf denen die 
Daten veroffentlicht wurden 
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<2Q7> 


Datum 


F 


Datum der Zeitschrift, an dem dip naf<i« 
verdffentlicht wurden; Angabe nach 
Mdglichkett entsprechend dem WIPO- 
Scandard ST. 2 (CCYY MM DO) 


<308> 


Eingangsnummer 
in der Datenbank 


F 


von der Datenbank zugeteilte Eingangs- 
nummer einschliefilich Datenbank- 
bezeichnung 


<309> 


Datenbank-Eingabedatum 


F 


Datum der Eingabe in die Datenbank; 
Angabe entsprechend dem WIPO- 
Standard ST. 2 (CCYY MM DO) 


<310> 


Ookumentennummer 


F 


Nummer des Dokuments, nur bei 
Patentdokumenten; die volistandige 
Nummer hat nacheinander folgendes 
zu enthalten: den zweibuchstabigen 
Code entsprechend dem WIPO-Standard 
ST 3, die Veroffentlichungsnummer 
entsprechend dem WlPO-Standard 
ST 6 und den Code fur die Dokurnenten- 
art nach dem WlPO-Standard ST 15 


'<3n> 


Anmeidetag 


F 


Anmeidetag des Dokuments, nur 
bei Patentdokumenten; Angabe 
entsprechend WlPO-Standard ST 2 
(CCYY MM DO) 


<312> 


Veroffentlichungsdatum 


F 


Datum der Veroffentlichung des Doku- 
ments; nur bei Patentdokumenten; 
Angabe entsprechend WlPO-Standard 
ST 2 (CCYY MM DD) 


<313> 


Relevante Reste in 
SEQ ID NO: x von bis 


F 




<400> 


Sequenz 


0 


SEO ID NO; x sollte in der der Sequenz 
vorausgehenden Zeile hinter der nume- 
rischen Kennzahl stehen (s. Aniage 3). 
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Anhang 2 

Symbole fur Nucleotide und Aminosauren und Merkmalstabellen 
Tabelle 1; Liste der Nucleotide 
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Symbol 


Bedeutung 


Ableitung der Bezeichnung 


a 


a 


Adenin 


9 


g 


Suanin 


c 


c 


Cytosin 


t 


t 


Thymin 


u 


u 


\J rac.li 


r 


g Oder a 


Purin 


Y 


t/u Oder c 


Pyrimidin 


m 


a Oder c 


Amino 


k 


g Oder t/u 


Keto 


s 


g Oder c 


Starke Bindungen 


w 


a Oder t/u 


schwache (e: weak) Bindungen 
2 H-Brucken 


b 


b Oder c Oder t/u 


nicht a 


d 


a Oder g oder t/u 


nicht c ' 


h 


a Oder c oder t/u 


nicht g 


V 


a Oder g Oder c 


nicht t, nicht u 


n 


a Oder g oder c oder t/u, unbekannt oder sonstige 


beiiebig (e: any) 
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Tabello 2: Listo der 


modifizierten Nucleotide 


Symbol 


Bedeutung ~" 


ac*ic 


4-AcetvlcYTidin 


chmSu 


S-iCarboxYhydroxym ethyl )uridin 


cm 


2'-0-Methylcytidin 


cmnm5s2u 


5-CarboxymethylaminomethYl-2-thtouridin 


cmnm5u 


5-Carboxymethylaminomethyluridin 


d 


Dihydrouridin 


fm 


2''0-Methylpseudouridin 


gal q 


beta, 0-Galactosylqueuosin 


gm 


2'-0-Methyiguanosin 


i Inosin 


ioa 


N6-Isopentenyladenosin 


mla 


1-Methyladenosin 


mlf 


1-Methylpseudouridin 


mig 


l-Methy(guanosin 


mlr 


l-Methylinosin 


m22g 


2.2-Dimethyiguanosin 


m2a 


2-Methyiadenosin 


m2g 


2-Methyiguanosin 


m3c 


3-Methylcytidin 


m5C 


5-Methy!cYtidtn 


m6a 


N6-Methyladenosin 


m7g 


7-Methylguanosin 


mamSu 


5-Methylaminomethyluridin 


mam5s2u 


5-Methoxyaminomethyr-2-thiouridin 


man q 


beta, D-Mannosequeuosin 


mcm5s2u 


5-MethoxYcarbonyimethyl-2-thiouridin 


mcmSu 


S-Methoxycarbonylmethyturidin 


moSu 


5-Methoxyuridin 


msliSa 


2-Methylthio-N6-tsopentenyladenosin 


ms2t6a 


N-({9-beta-0-Ribofuranosyi-2-methy!thiopurin-6-yO carbamoyl) threonin 


mt6a 


N-({9-beta-0-Ribofuranosylpurin-6-yON-methylcarbamoynthreonin 


mv 


Uridin-5-oxyessigsauremethylester 


o5u 


Uridin-5-oxyessigsaure (v) , * 


osyw 


Wybutoxosin 


P 


Pseudouridin 
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q 


Qeuosin 




s2c 2-Thiocytidin ' ' 


s2t 


5-Methyl-2-thtouridin 




s2Lr 


2-Thiouridin 






4.-Thiouridin 




t 


5-Methyluridin 




to3 


N-((9-beta-0-RibofuranosYlpurin-6-yl) carbamoyDthreonin 




tm 


2'-0-Methyl-5-methyluridin 




um 


2'-0-Methyluridin 




yw 


Wybutosin 




X 


3-(3-Amino-3-carboxYpropyl)uridin, (acp3)u 




Tabelle 3: Liste der Aminosauren 


Symbol 






Ala 


Alanin 




Cys 


Cystein 




Asp 


AsparaQinsaure 




Glu 


Glutaminsaure 




Phe 


Phenylalanin 




Giy 


Glyctn 




His 


Histidin 




lie 


fsoleucin 




Lys 


Lysin 




Leu 


Leucin 




Met 


Methionin 




Asn 


Asparagin 




Pro 


Proiin 




Gin 


Glutamin 




Arg 


Arginin 




Ser 


Serin 




Thr 


Threonin 




Vai 


Valin 




Trp 


Tryptophan 




Tyr 


Tyrosin 




Asx 


Asp Oder Asn 




Glx 


Glu Oder Gin 




Xaa 


unbekannt oder sonstige 
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Tabelle 4: Liste der modifirierten und seltenen Amtnosauren 



SymDOl 


Bedeutung 




Aad 


2-Aminoadipinsaure 




bAad 


3-Aminoadipinsaure 




bAla 


beta-Alanin, beta-Ami nopropionsau re 




Abu 


2-Aminobunersaure 




AAbu 


4.-Arninobunersaure, Piperidrnsaure 




Acp 


6-Aminocapronsaure 




Ahe 


2-Aminoheptansaure 




Aib 


2-Aminoisoburtersaure 




bAib 


3-Aminoisobuttersaure 




Apm - 


2-Aminopimelinsaure 




Dbu 


2,4.-Diaminobuttersaure 




Oes 


Desmosin 




Dpm 


2,2'-Diaminopirnelinsaure 




Dpr 


2,3-Oiaminopropionsaure 




EcGiy 


N-£thylglycin 




EtAsn 


N-Ethytasparagin 




Hyi 


Hydroxylysin 




aHyl 


allo-Hydroxyfysin 




3Hyp 


3-Hydroxyprolin 




4.HYP 


4.-Hydroxyprolin 




Ide 


Isodesmosin 




afle 


allo-lsoleucin 




MeGty 


N-Methylglycin, Sarkosin 




(Vlelle 


N-Methylisoleucin 







o-iN-ivieinynysin 




MeVal 


N-Methylvalin 




Nva 


Norvalin 




NIe 


Norleucin 




Orn 


Ornithin 
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Tabelle 5: Liste der Merkmalschlussel zu Nucleotidsequenzen 



Schtussel 


Beschreibung ' ' , 


vervvandtes Individuum Oder em verwandter Stamm enthalt stabile alternative Formen 
oesselben Gens und untersche.det sich an dieser (und vielleicht an anderer) Steile von der 
vorliegenden Sequenz. 


artenuacor 


1. Region einer DNA. m der die Beendigung der Transkription reguliert wird und die Exoression 
^""yci uoMcrieuer (^perons gesteuerc wird 

2. zwischen dem Promoter und dem ersten Strukturgen liegender Sequenzabschnin der eine 
partieMe Beendigung der Transkription bewirkt 


C_region 


konstante Region der ieichten und schweren Immungiobulinkenen und der Alpha- Beta- und 
Gamma-Ketten von T-2el!-Rezeptoren; enthalt je nach Kette ein oder mehrere Exons 


CAAT_signal 


CAAT-Box; Teil einer konservierten Sequenz. der etwa 75 Basenpaare stromaufwarts vom 
Starrpunkt der eukaryontischen Transkriptionseinheiten liegt und an der RNA-Polymerase- 
wiiiuuiiy uciciM^i sein Kann, Nonsensussequenz ~ GG (C oderT) CAATCT 


CDS 


codierende Sequenz; Sequenz von Nucleotiden, die mit der Sequenz der Aminosauren in einem 
.wicui uucremstimmc loemnaitet ocopcodon), ivierKmai schlieBt erne mogliche Translation der 
Aminosaure ein 


conflict 


Unabhangige Oeterminierungen "derselben" Sequenz unterscheiden sich an dieser Steile oder 
n dieser Reaion vonpinAnripr 


D-Ioop 


D-Schleife; Region innerhalb der nnitochondrialen DNA, in der sich ein kurzeres RNA-Stuck mit 
11 ^(.loiiy ucr aoppetstrangigen utNM paart una daDei den ursprunglichen Schwesterstrang 
m dieser Region verdrangt; dient auch zur Beschreibung der Verdrangung einer 
emzelstrangigen Region des DNA-Ooppelstrangs durch einen einzeistrangigen Eindringling bei 
der durch ein recA-Protein ausgelosten Reaktion 


D-segment 


Diversity-Region der schweren Kette von Immunglobulin und der Beta-Kerte eines T-Zell- 
Rezeptors 


enhancer 


ciiic ai&v^i:> Clement wirKenae :>equenz, die die Akttvitat (einiger) eukaryontischer Promotoren 
verstarkt und in befiebiger Richtung und Position zum Promotor (stromaufwarts oder -abwarts) 
funktioniert 


exon 


Region des Genoms, die fur einen Teil der gespleiGten mRNA codiert; kann 5'UTR, alle CDSs 
und 3 UTR enthaiten 


GC_signal 


GC-Box; eine konservierce, GC-reiche Region stromaufwarts vom Startpunkt der 
eukarvontischen Transkriptionseinheiten, die in mehreren Kopien und in beiden Richtungen 
V wi t\ui 1 11 1 icn ^ann, isonsensussequenz = GGGCGG 


gene 


biologisch signifikante Region, die als Gen bezeichnet wird und einen Namen tragt 


iONA 


v^. vc.,,,=, criiuc ui>4M, uiNM, aie aurcn verscniedene Arten der Rekombmatton eliminiert wird 


intron 


DNA-Abschnitt, der transkribiert, aber beim ZusammenspleiSen der ihn umrahmenden 
Sequenzen (Exons) aus dem Transkript wieder herausgeschninen wird 


J_segnnent 


J-Kette (Verbindungskette) zwischen den Ieichten und den schweren Immunglobulinketten und 
den Alpha-, Beta- und Gamma-Kenen der T-Zell-Rezeptoren 


LTR 


lange Terminalwiederholung, eine an den beiden Enden einer gegebenen Sequenz direkt 
wieaernoite bequenz, wie sie fur Retroviren typisch ist 


mat.pepcide 


fur ein reifes Peptid oder Protein codierende Sequenz; Sequenz, die im AnschluS an eine 
posttranslationale Modifizierung fur das reife oder endgultige Peptid- oder Proteinprodukt 
coaiert; schlieGt tm Gegensatz zur entsprechenden CDS das Stopcodon nicht ein 


misc_binding 


Scene in einer Nucleinsaure, die einen anderen Teil, der nicht durch einen anderen Bindungs- 
schiussel (pnmer.bind oder protetn_bind) beschrieben werden kann, kovalent oder nicht 
kovalent bindet 


misc_difference 


Untii^^'h^H ^'"^ '^^^ ^'"^'^9 ""'^ l^^"" durch einen anderen 

i. F!^*"^'""*' '""^'"^^ unsure, old.sequence, mutation, variation, allele bzw 
moairtea_Dase) beschrieben werden. 
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misc. feature 


biologisch signifikante Region, die nichi durch einen anderen Merkmaischlussel beschrieben 
werden kann; neues oder sellenes Merkmal 


misc.recomb 


Stelle. an der ein allgemeiner, ortsspezifischer oder replikativer Rekombinationsvorgang start- 
findet. bei dem die ONA-Doppelhetix aufgebrochen und wieder zusammengefugi wird. und 
die nicht durch andere Rekombinationsschlussel {iDNA oder Virion) oder den betreffenden 
Herkunftsschlussel (/insertions_seq, /transposon. /proviral) beschrieben werden kann 


misc.RNA 


Transkript oder RNA-Produkt. das nicht durch andere RNA-Schlussel (prim^transcript, 
precursor_RNA, mRNA. 5'ciip, 3'clip, 5'UTR. 3'UTR, exon, CDS. sig_peptide, transit_pepiide, 
mat_peptide. intron, polyA_site, rRNA, tRNA, scRNA oder snRNA) beschrieben werden kann 


misc_signal 


Region, die ein Signal enthalt, das die Genfunkxion oder -expression steuert oder andere, und 
die nicht durch andere Stgnalschlussel (promoter, CAAT_sign3l, TATA^signal, -35_signal, 
-10_signal. GC_signai, R8S, polyA_signal, enhancer, anenuator, terminator oder rep_origin) 
beschrieben werden kann 


misc.structure 


Sekundar-. Tertiar- oder sonstige Struktur oder Konformation, die nicht durch andere 
Scrukturschiiissel (stemjoop Oder 0-loop) beschrieben werden kann 


modified.base 


Das angegebene Nucleotid ist ein modiflziertes Nucleotid und ist durch das angegebene 
Molekul (ausgedruckt durch die modiftzierte.Base) zu ersetzen. 


mRiNA 


messenger-RNA (Boten-RNA); enthalt eine 5'-nichTtranslatierce Region (5'UTR), codierende 
Sequenzen (CDS, Exon) und eine 3'-nichttranslatierte Region (3'UTR) 


mutation 


Ein verwandter Stamm weist an dieser Stelle eine plotzliche, erbtiche Sequenzveranderung auf. 


N_region 


zusatzliche Nucleotide, die rwischen neu geordnete Immunglobulinabschnirte eingefugi werden 


old_sequence 


Die vorfiegende Sequenz stellt eine geanderte Version der fruher an dieser Stelle befindlichen 
Sequenz dar. 


polyA_signai 


Erkennungsregion, die zur Endonuclease-Spaltung eines RNA-Transkripts mit anschlieGender 
Polyadenyiierung ndtig ist; Konsensussequenz: AATAAA 


polyA_site 


Stelle auf einem RNA-Transkript, an der durch posnranslationale Polyadenyiierung Adeninresxe 
eingefugt werden 


precursor_RNA 


noch nicht gereifte RNA-Spezies; kann eine am 5'-£nde abzuschneidende Region (5'Clip), eine 
5'-nichttranslatierte Region (5'UTR), codierende Sequenzen (CDS, Exon), intervenierende 
Sequenzen (Intron), eine 3'-nichttranslatierte Region (3'UTR) und eine am 3'-Ende abzuschnei- 
dende Region (3'Clip) enthalten 


prim_transcript 


primares (ursprungltches, nicht prozessiertes) Transkript; enthalt eine am 5'-Ende 
abzuschneidende Region (5'CIip), eine 5'-nichnransiatierte Region (5'UTR), codierende 
Sequenzen (CDS, Exon), intervenierende Sequenzen (Intron), eine 3'-nichttransIatierte Region 
(3'UTR) und eine am 3'-Ende abzuschneidende Region {3'CIip) 


primer_bind 


nichtkovalente Primer-Bindungssteile fur die Initiierung der Replikation, Transkription oder 
reversen Transkription; enthalt eine oder mehrere Stellen fur synthetische Elemente, z. B. 
PCR-Primerelemente 


promoter 


Region auf einem ONA-Molekul, die an der Bindung der RNA-Polymerase beteiiigt ist, die die 
Transkription initiierc 


protein.bind 


nichtkovalente Protein-Bindungsstelle auf der Nucleinsaure 


: RBS 


ribosomale Bindungsstelle 


repeat_region 


Genomregion mit repetitiven Einheiten 


repeat.unit 


einzelnes Repeat (repetitive Einheit) 


rep.origin 


Replikationsursprung; Startpunkt der Ouplikation der Nucleinsaure, durch die zwei identische 
Kopien entstehen 


rRNA 


reife ribosomale RNA; RNA-Komplex des Ribonucleoprotein-Parcikels (Ribosom), der 
Aminosauren zu Proteinen zusammenfugt 


S.region 


Switch-Region der schweren Immunglobulinketten; beteiiigt am Umbau schwerer DNA-Ketten, 
der zur Expression einer anderen Immunglobulin-KIasse aus derselben B-Zelle fuhrt 
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1 " 'Vl^qft 


satellite 


v.ele tandemamg h.nteremandergeschaltete (identische Oder verwandte) Repeats einer \c^^ 

basfschen repetitiven Einheit; viele davon unrpr«:rhf»iripn cirh in Har r^^^^-t..^, ^'"cr Kurjen 

^ ^"lerscnetaen sicn in aer basenzusammensetrunn 
Oder emer anderen Eigenschaft vom Genomdurchschnin und konnen so von der HauotmasL 
der genomischen DNA abgetrennt werden "M^Tiasse 


scRNA 


kteine cvtODlasmische RNA* eines von m*»hrciror» i^iainan /-w^y-.ni't^Mi^^KA^ dm,^ a • ■ . 

r«-^K fit^^, cMico vuli menreren Kieinen cytoplasmiscnen RINA-Molekulen im 

Cytoplasma und (manchmal) im Zellkern eines Eukaryonren 


sig_pepcicle 


^Ur ein Sicnaloeotid codierpnrip ^PotiPr»T* Q^artiian-r Hli* fi\^ M • ^ ^ ^ : ^ ^ 1 „ - 

1 i-vjuicieruuc oeuiuenz. ^sequent, QIC Tur eine N-terminale Domane eines 

sekretonschen Proteins codiert; diese Domane spielt bei der Anheftung des nascierenden 

Polypeptids an dre Membran etne Rolle; Leader-Sequenz 


snRNA 


kleine Kern-RNA; eine der vielen kleinen RNA-Formen, die nur im Zellkern vorkommen; einige • 
' '^'^ ^vjicicii ucim «3)jiciuc(i uucr uei anoeren rMNA-veraroeitenuen neakrionen eine Rolle 


source 


Bezeichnet die biologische Herkunft des genannten Sequenzabschnitts; die Angabe dieses 

wkjii^aLUf jcuci tinLidg mufi minoesuens etnen rierKunrcsscniussel aufweisen, 
der die gesamte Sequenz umfai3t; es durfen zu jeder Sequenz auch mehrere Herkunftsschlussel' 
angegeben werden. 


stem Joop 


Haarnadeischleife* eine Doooelhelix-Reainn rtio riitmH Raeann^'s**! tm/-* 'via>i'<«/«kai-i WA^^^^uu.-i* 
« •uvj^i^^t itt^i ■ ^, ciiic (^upi^cii tci ly^ ncyiuii, Qis uurcn Dasenpaarung zwiscnen Denacnbarten 

(invertiercen) komplementaren Sequenzen in einem RNA- Oder DNA-Einzelstrang entsteht 


STS 


Sequence Tagged Site; kurze, nur als Einzelkopie vorkommende ONA-Sequenz, die einen 
Kartierungspunkt auf dem Genom bezeichnet und durch PGR erminelt werden kann; eine 

neqion auf dem Genom kann durch B&^fimmiin<-t Har QaiKAnfr^i<-t£s Me^r ctc*. i,*,^:^^ 

awii \^i^it> vjciiwiK ivai II 1 uui 1 tstjiiirtimung oer neinenroige oer o i os icartiefT werden 


TATA_signai 


TATA-Box; Goldberg-Hogness-Box; ein konserviertes AT-reiches Septamer, das sich rund 25 
Sasenpaare vor dem Startpunkt jeder eukaryontischen RNA-Polymerase-II-Transkriptionseinheit 

bermdet und bet der Positionieruna des PnTvmc H'tr oino VorraUra ini^iari/^n Oy^ii^ ^^:^t^^ 
uiiwi \j t- i uoiLiw* MCI uiiy ciiiyrni lur eine ivorreicte initiation eine nOile spielen 

kann; Konsensussequenz = .TATA(A oder T)A(A oderT) 


terminator 


DNA-Sequenz. die entweder am Ende des Transkripts Oder neben einer Promotor-Region liegt 

und bewirkt, daQ die RNA-Poivmerase riip TrancWrirtrinn hAAnHar- L--anfi ^itt/^w o:..^...^^^»ii^ 
w li rvfc, ruiyiiiciadc ults 1 ransKri ption oeenuet, Kann aucn oie bindungsstelie 

eines Repressor-Protetns sein 


transit_peptide 


^ijr TransitDeotid codierende Sanuenz* ^pnnon-y fHr aina m ^i^^r<nin-^ia r\^m:;n^ 

wt wwuiciciiuc *lJc^ucll^, oequeni, uie lur eine iN-terminaie uomane eines im 

Zellkern codierten Organellen-Proteins codiert; diese Domane ist an der posttranslationalen 

Einschleusuno des Prnt^in^ in dip Orrranollo Haf-aiit/^'t 


tRNA 


reife transfer-RNA, ein kleines RNA-MoiekQI (75-85 Basen lang), das die Translation einer 
Nucleinsaure-Sequenz in eine Aminosaure-Sequenz vermittelt 


unsure 


Der Autor kennt die Sequenz in dieser Region nicht genau. 


V_region 


variable Region der ieichten und schweren Immunglobulinketten sowie der Alpha-, Beta- und 

vsamma-Kstten von T-Zell-Re^eotoren* cnrii^rr fi'*ir Hae VyartaKia Ai^:rti^An<-ia< \/ o m 
w irvjn 1 i.cii rvc;^c{jL^ji I, uuuicit Tur uas vanaoie MminQsnoe; Kann aus u-, in* 

und J-Abschnttten bestehen 


V-segment 


variabler Abschnitt der Ieichten und schweren Immunglobulinketten sowie der Alpha-, Beta- 

und Gamma-Ketten von TZell-Rezeotorpn* mHtarr ft\r Han r^roft^aii r^^r- v^'sf^'suian oa»:«.» 

■'^"-*'^^*» "•w" 1 ten ' ^^icy tvji ei 1, couierx 1 ur Qen vjroiiteii oer variaDien negion 

{V_region) und die letzten Aminosauren des Leader-Peptids 


variation 


Ein verwandter Stamm enthalt stabile Mutationen desselben Gens (z. S. RFLPs, Poiymorphis- 
men usw.), die sich an dieser (und moglicherweise auch an anderer) Stelle von der vorliegen- 
den Seouenz unterscheidpn 


3'clip 


3 -auSerSte Reoion **inp<5 Pra/^tir^or-TranoL-ftr^^e' j^ia v^ai Dma-.^^^: . ^. _ _ i_ • _i 

•wt^i^vc^ i«cvjiui( cii)e:> rrecurbor iransKTipts, aie Dei Oer rrozessierung abgeschnitten wird 


3'UTR 


Region am 3'-Ende eines reifen Transkripts (nach dem Stopcodon), die nicht in ein Protein 
translatiert wird 


5'clip 


5'-auSerste Region eines Precursor-Transkripts, die bei der Rrozessierung abgeschninen wird 


5'UTR 


negion am 5 -Ende eines reifen Transkrinr^ {\/nr Ham tnifiarirtne/*rt<-</-\r»\ <Hi^a ^i,*^* d»««>»:«. 
... wt. » icii • • »• i^jL^ vvur uem iniLiaiionscouon/, uie nicnt in ein Krotetn 
translatiert wird 


-10_signal 


Pribnow-Box; konservierte Region rund 10 Basenpaare stromaufwarts vom Startpunkt der 
oaktenellen Transknptionseinheiten, die bei der Sindung der RNA-Polymerase eine Rolle spielt; 
konsensussequenz = TAtAaT 


•35_signal 


konserviertes Hexamer rund 35 Basenpaare stromaufwarts vom Startpunkt der bakterieiien 
iranskriptionseinheiien; Konsensussequenz =i TTGACa [ ] oderTGTTGACA [ ] 
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Beschreibung 


COfMPI ITT 


In den einzelnen Unterlagen ist von verschiedenen Sequenzen die Rede. 


VARIANT 


Den Angaben der Autoren zufolge gibt es Sequenzvarianten, 




Beschreibung von Sequenzvarianten, die durch alternatives SpleiBen entstanden sind 


Ml tTAHPiV 


experimentell veranderte Stelle 




posnranslationale Modifikation eines Rests 


ACETYLATION 


N-terminale oder sonsti'ge 


AMIDATiniSJ 


in der Regel am C-Terminus eines reifen akriven Peptids 


BLOCKED 


unbestimmte Gruppe, die das N- oder C-terminale Ende blockiert 


FO R M YLATI O N 


des N-ierminalen Methionin 


GAMMA- 

CARBOXYGLUTAMIC 
ACID HYDROXYLATION 


von Asparagin, Asparaginsaure, Prolin oder Lysin 


M£THYU\T10N 


in der Regel von Lysin oder Arginin 


PHOSPORYLATION 


von Serin. Threonin, Tyrosin, Asparaginsaure oder Histidin 


PYRROL IDONP 


N-terminales Glutannat, das ein internes cyclisches Lactam gebildet hat 


CARBOXYUC ACID 
SULFATATION 


in der Regel von Tyrosin 


LIPID 


kovalente Bindung einer Lipidhalfte 


MYRISTATE 


Myristat-Gruppe, die durch eine Amidbindung an den N-terminalen Glyctn-Rest der 
reifen Form ernes Proteins oder an einen internen Lysin-Rest gebunden ist 


PALMITATE 


Palmitat-Gruppe, die durch eine Thioetherbindung an eirien Cystein-Rest oder durch 
eine Esterbindung an einen Serin- oder Threonin-Rest gebunden ist 


FARNESYL 


Farnesyl-Gruppe, die durch eine Thioetherbindung an einen Cystein-Rest 
gebunden ist 


GERANYL-GERANYL 


vjeranyi-geranyi-vjruppe, uie Gurcn eine t nioetnerDinoung an einen Cystein-Rest 
gebunden ist 


GPI-ANCHOR 


Glykosyl-phosphatidylinositol-{GPI-)Gruppe, die an die alpha-Carboxyigruppe des 
C-terminalen Rests der reifen Form eines Proteins gebunden ist 


1M-ACYL DIGLYCERIDE 


N-terminales Cystein der reifen Form eines prokaryontischen Lipoproteins mit einer 
amidgebundenen Fensaure und einer Glyceryl-Gruppe. an die durch Esterbindungen 
zvvei Fettsauren gebunden sind 


DISULFIO 


Disulfidbindung; den 'VON"- und den "BIS'-Endpunkt bilden die beiden Reste, die 
uuiuii cine Rctieninierne L/iouiiiuuinuung veruunoen sine, sine der vl/im - una der 
"BIS'-Endpunkt identisch, liegt die Disulfidbindung innerhalb der Kette, und die Art 
der Querverneaung ist im Beschreibungsfeld anzugeben 


THIOLEST 


Thiolesterbindung; den "VON"- und den "BIS"-Endpunkt bilden die beiden Reste, die 
durch die Thiolesterbindung verbunden sind 


THIOETH 


Thioetherbindung; den "VON"- und den "BIS"-Endpunkt bilden die beiden Reste, die 
durch die Thioetherbindung verbunden sind 


CARBOHYD 


Glykosylierungs-Stelle; die Art des Kohlenhydrats (sofern bekannt) ist im 
Beschreibungsfeld anzugeben 


METAL 


Bindungsstelle fur ein Metallion; die Art des Metalls ist im Beschreibungsfeld 
anzugeben 
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BINDING 


Bindungsstelle fur e.ne beliebige chemische Gruppe (Coenzym, prosrhetische Grunn^ ^ 
usw.), die Aft der Gruppe »st im Beschreibungsfeld anzugeben • - . 


SIGNAL 


^ Bereich einer Signalsequenz (Prapeptid) 


TRAN^^IT 


Bereich eines Transit-Peptids (mitochondriales, chloroplastisches oderfiir 
Microbodies) 


PROPER 


Bereich eines Propeptrds 


rW AIM 


Bereich einer Poiypeptid-Kette im reifen Protein 


rc" 1 ILJC 


Bereich eines freigesetzten aktiven Peptids 


UVJiVIMllN 


Bereich einer wichtigen Oomane auf der Sequenz; die Art dieser Domane ist im 
Beschreibungsfeld anzugeben 




Bereich einer Calcium-bindenden Region 


U1NM_D1InLJ 


Bereich einer DNA-bindenden Region 


r _Dt IN LJ 


Bereich einer Nucleotidphosphat-bindenden Region; die Art des Nucleotidphosphats 
ist im Beschreibungsfeld anzugeben 




Bereich einer Transmembran-Region 


t.lN_r MN w 


Bereich einer 2ink-Finger-Region 




Grad der Ahnlichkeit mit einer anderen Proteinsequenz; im Beschreibungsfeld sind 
genaue Angaben uber diese Sequenz zu machen 


RPPPAT 


Bereich einer internen Sequenzwiederholung 


HELIX 


Sekundarstruiaur: Helices, z. B. Alpha-Helix, 3(10)-Helix oder Pi-Helix 


STRAND 


Sekundarstruktun Beta-Strang, z. 8. durch Wasserstoff-Bruckenbindungen 
stabilisierter Beta-Strang, oder Rest in einer isoiierten Beta-Brucke 


TURN 
1 w n IN 


Sekundarstruktun Schleife, z. B. durch Wasserstoff-Bruckenbindungen stabilisierte 
Schleife (3-, 4- oder 5-SchIeife) 


ACT_SITE 


Aminosaure(n), die bei der Aktivitat eines Enzyms mitwirkt (mitwirken) 


SITE 


irgendeine andere wichtige Stelle auf der Sequenz 


INIT MET 


die Sequenz beginnt bekanntermaSen mit einem Start-Methionin 


NON^TER 


Der Rest am Sequenzanfang oder -ende ist nicht der Terminalrest; steht er an der 
Position 1, so bedeutet das, daS diese nicht der N-Terminus des vollstandigen 
Molekuls ist; steht er an letzter Position, so ist diese Position nicht der C-Terminus 
des vollstandigen Molekuls; fur dresen Schlussel gibt es kein Beschreibungsfeld. 


NON.CONS 


nicht aufeinanderfoloende Reste* 7^iaT an ri^CK tva/a! R^ctia in ainar ^amianT nir-v^t 
aufeinanderfolgen, sondern daS zwischen ihnen einige nichtsequenzierte Reste liegen 


UNSURE 


Unsicherheiten in der Sequenz; mit diesem Schlussel werden Regionen einer 
Sequenz beschrieben, bei der sich der Autor bezugiich der Sequenzzuweisung nicht . 
sicher ist 
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Anhang 3 

Muster eines Sequenzprotokolls 



<LLO> 


Smich. John; Smichgene Inc. 








<L20> 


3eispiei £ur ein SequenzprocokolL 






<L30> 


01-00001 








<140> 
<L41> 


PCT/EP93/0000L 
L998-12-31 








<I50> 
<15L> 


1997-10-15 








<L50> 


4 








<170> 


Pacencin Version 2.0 








<:210> 
<?!!> 
<212> 
<213> 


1 

389 
DMA 

Parairvecium sp. 








<220> 
<22I> 
<222> 


COS 

(279) . . . (389) 








<300> 
<301> 
<302> 

<303 > 
<304> 
<305> 
<306> 
<jQf> 
<308> 
<305> 


Doe, Richard 

Isoiacion and Characcerizacion of a Gene Encoding a 

from Paramecium sp . . 

Journal of Genes 

1 

4 

1-7 

1988-06-31 

123456 

1988-06-31 


Procease 


<400> 


1 








agccgcagcc 


acccccgcgc cccccccccc 


ccgggccccc 


caccccgcca 


accagacccc 


agggagagcg 


ccccgacccc cccccgcccc 


cgcagcccca 


caggcaggca 


ggcaggcagc 


cgacgcggca 


accgccggca gcgccacagg 


ccccccagcc 


agg.cccaggg 


cgggccccgc 


cgcggcgcgg 


cggccccccc cgcgcccccc 


ccgcgccccc 


cccccgcccc 


ccccccgccc 


ggacctgarr 


aggcgagcag gaggaggggg 


cagccagc 


acg gcc cca 
Mec Val Ser 
1 


acg ccc 
Mec Phe 
5 


Ciig ccc 
Leu Ser 


ccc aaa egg ccc gga cc> 
Phe Lys Trp Pro Gly Phe 
10 


cgc ccg 
Cys Leu 
15 


ccc gcc cgc 
Phe Val Cys 


ccg ccc 
Leu Phe 
20 


cgc ccc 
Cys Pro 


aaa gcc ccc ccc cgc cac 
Lys Val Leu Pro Cys His 
25 30 


cca cca 
Ser Ser 


ccg cag ccg 
Leu Gin Pro 
35 


aac ccc 
Asn Leu 



age 
Ser 



caa 
Gin 



60 
120 
180 
240 

296 
344 
•389 
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<2L0> Z 

<2il> 37 

<212> PRT 

<213> Paramecium sp. 

<40o> : 



Mec: Vdl 
1 


Ser 


Mec 


Phe 
5 


Ser 


Leu 


Ser 


Phe 


Lys 
10 


Trp 


Pro 


Pi^e Val 


Cys 


Leu 
20 


Phe 


Glr. 


Cys 


Pro 


Lys 
25 


Val 


Leu 


Pro 


Leu Gin 


Pro 
35 


Asn 


Leu 
















<210> 
<2Ii> 
<212> 




3 

11 
PRT 



















-ys Leu 
15 



30 



<213> Kur.s cliche Sequenz 

<220> 

<223> Pepcid, das nach GrbSe und Polaricac als Verbir.dung zwischen den 

Alpha- und Beca-Xeccan des Proceins XY2 konzipierc" isc 

<400> 3 ' 

Mec Vai Asn Leu Glu Pro Mec Kis Thr Glu lie 
15 10 



<210> 
<400> 
000 



4 
4 
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Appendix 1 
Numeric identifiers 

Only numeric identifiers as defined 
below nnay be used in sequence 
listings submined in applications. 
The text of the data elennent head- 
ings given below shall not be 
included in the sequence listings. 



Numeric identifiers of mandatory 
data elements, that is. data elements 
which must be included in all 
sequence listings {see paragraph 25 
of this Standard: items 110, 120, 160. 
210, 21 1. 212. 213 and 400) and 
numeric identifiers of data elements 
which must be included in circum- 
stances specified in this Standard 
(see paragraphs 26. 27, 28, 29 and 30 



of this Standard: items 130. 140 -j^, 
ISO and 151, and 220 to 223) are 
marked by che symbol "M". 

Numeric identifiers of optional 
data elements (see paragraph 3i 
of this Standard) are marked by 
the symbol "O". 



Numeric 
Identifier 


Numeric Identifier 
Description 


Mandatory (M) or 
Optional (O) 


Comment 


<no> 


Applicant name 


M 


where the name of the applicant is 
written in characters other than those of 
the Latin alphabet, the same shall also 
be indicated in characters of the Latin 
alphabet either as a mere transliteration 
or through translation into English 


<120> 


Title of invention 


M 




<130> 


File reference 


ivt, in me circumstances 
specified in paragraph 26 
of this Standard 


see paragraph 26 of this Standard 


<140> 


Current patent application 


M, in the circumstances 
specified in paragraph 27 
of this Standard 


see paragraph 27 of this Standard; the 
current patent application shall be 
identified, in the following order, by the 
two-lener code indicated in accordance 
with WIPO Standard ST.3 and the 
application number (in the format used 
by the industrial property Office with 

whiph fhA r'lirrprrf nat^nt armlica"rion 

V V lilVall Lliw wUllwllv UOvdlL aLJLJIIWOWIVJII lO 

filed) or, for an international application, 
by the international application number 


<U1> 


Current filing date 


M, in the circumstances 

o Cwl 1 1 eu 111 ^ola^ld^'* 

of this Standard 


see paragraph 27 of this Standard; the 

UdLc ^iiaii uc; iiiuiwoccu in accuruoi luc 

with WIPO Standard ST.2 


<150> 


Earlier patent application 


fV/1 in th^ pirpi I m a ni* 

111 ^iit; ^1 1 ■ I o io • iwca 

Specified in paragraph 23 
of this Standard 


COO n^r^rtr^ryhi ^ft fhic ^^an^^ar/^• fho 

earlier patent application shall be 
identified, in the following order, by the 
two-letter code indicated in accordance 
with WIPO Standard ST.3 and the 
application number (in the format used 
by the industrial property Office with 
which the earlier patent application was 
filed) or, for an international application, 
by the international application number 


<151> 


Earlier application filing date 


M, in the circumstances 
specified in paragraph 28 
of this Standard 


see paragraph 28 of this Standard; the 
date shall be indicated in accordance 
with WIPO Standard ST.2 
(CCYY MM DO) 


<160> 


Number of SEQ ID NOs 


N\ 




<170> 


Software 


O 




<210> 


Information for SEQ ID NO: x 


M 


response shall be an integer represent- 
ing the SEQ ID NO shown 


<2n> 


Length 


M 


sequence length expressed in number 
of base pairs or amino acids 


<212> 


Type 


M 


type of molecule sequenced in SEQ ID 
NO: X, either DNA, RNA or PRT; if a 
nucleotide sequence contains both DNA 



<220> 



and RNA fragments, the value shall be 
"DNA"; in addition, the combined ONa/' 
RNA molecule shatfbe funher descrth'Tr! 
in the <220> to < 223> feature section 

Genus Species (that is, scientific name) 
or "Anificial Sequence" or "Unknown" 



Feature 



in the circumstances 
specified in paragraph 29 
and 30 of this Standard 



leave blank; see paragraphs 29 and 30 
of this Standard; description of points of 
biological significance in the sequence 
in SEQ ID NO: x) (may be repeated 
depending on the number of features 
indicated) 



<221> 



Name/key 



M, in the circumstances 
specified in paragraph 29 
of this Standard 



see paragraph 29 of this Standard; only 
those keys as described in Table 5 or 6 
of Appendix 2 shall be used 



<222> 



Location 



in the circumstances 
specified in paragraph 29 
of this Standard 



see paragraph 29 of this Standard; 

- from (number of first base/amino acid 
in Che feature) 

- to (number of last base/amino acid in 
the feature) 

- base pairs (numbers refer to positions 
of base pairs in a nucleotide sequence) 

- amino acids (numbers refer to posi- 
tions of amino acid residues in an amino 
acid sequence) 

- whether feature is located on the 
complementar/ strand to that filed in 
the sequence listing 



<223> 



Other information 



M, in the circumstances 
specified in paragraphs 29 
and 30 of this Standard 



see paragraphs 29 and 30 of this Stan- 
dard; any other relevant information/ 
using language neutral vocabulary, or 
free text (preferably in English); any free 
text is to be repeated in the main part of 
the description in the language thereof 
(see paragraph 36 of this Standard); 
where any modified base or modified/ 
unusual L-amino acid appearing in 
Appendix 2, Tables 2 and 4, is in the 
sequence, the symbol associated with 
that base or amino acid from Appen- 
dix 2, Tables 2 and. 4, should be used 



<300> 



Publication information 



<301> 



leave blank; repeat section for each 
relevant publication 



Authors 



<302> 


Title 


0 


• ^ — . 

title of publication 


<303> 


Journal 


o 


iourna! name in which data published 


<304> 


Volume 


0 


Journal volume in which data published 


<305> 


Issue 


0 


journal issue number in which data 
published 


<306> 


Pages 


0 


journal page numbers on which data 
published 


<307> 


Date 


0 


journal date on which data published; if 
possible, the date shall be indicated in 
accordance with WlPO Standard ST.2 
(CCYY MM DO) 


<308> 


Database accession number 


0 


accession number assigned by database 
including database name 
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<309> 


Database entry dace O 


date of entry in database; the date shall 
be indicated in accordance with WIPQ 
Standard ST.2 (CCYY MM DO) 


<310> 


Oocumenc number O 


document number, for patent type 
citations only; the full document shall 
specify, in the following order, the two- 
lener code indicated in accordance with 
WlPO Standard ST.3, the publication 
number indicated in accordance with 
WlPO Standard ST.6, and the kind-of- 
document code indicated in accordance 
with WlPO Standard ST.16 


<311> 


Filing date O 


document filing date, for patent-type 
citations only; the date shall be 
indicated in accordance with WlPO 
Standard ST.2 (CCYY MM DO) 


<312> 


Publication date O 


document publication date; for patent- 
type citations only; the date shall be 
indicated in accordance with WlPO 
Standard ST,2 (CCYY MM DO) 


<313> 


Relevant residues in 0 
ScQ ID NO: x: from to 




<400> 


Sequence - M 


SEQ ID NO; x should follow the 
numeric identifier and should appear 
on the line preceding the sequence 
{see Appendix 3) 
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Appendix 2 






Nucleotide a 


nd amino acid symbols and feature tabi 


e 


Table 1: List of Nucleotides 




Symbol 


Meaning 


1 1 u III w i U w ^ 1 u • 1 a L 1 \J f 1 


a 


a 


^rlpn in A 

2 w w t 111 I w 


9 


g 


mooinA 
1 1 1 1 ic 


c 


c 




t 


t 


ii lyiTi iric 


u 


u 


^racil 


r 


g or a 


pu rt nG 


y 


t/u or c 


nv/rlmrriinp 

^ jl^i 1 1 1 1 1 U 111 w 


m 


a or c 


amino 


K 


g or t/u 


Iseto 


s 


g or c 


Strong interactions 
3H-bonds 


w 


a or t/u 


weak interactions 
2H-bonds 


b 


gore or t/u 


not a 


d 


a or g or t/u 


not c 


h 


a or c or t/u 


not g 


V 


a or g or c 


not t, not u 


n 


a or g or c or t/u, unknown, or other 


any 
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Table 2: List of Modified Nucleotides 



Symbol 


Meaning 


1 


ac4c 


4-acetvlcYticiine 




chmSu 


5-(carboxyhydroxymethyl)uridine 




cm 


2'-0-methylcyTidine 




cmnm5s2u 


5-ca rboxvm(*rhvlami no m ethvl*2 - fh im iririi n*» 




cmnmSu 


5-carboxymethy(aminomethy lurid in© 




d 


dihydrouridine 




fm 


2'-0-methylpseudouridine 




gal q 


beta, D-galactosylqueuosine 




gm 


Z'-O-methylguanosine 




i Inosine 


i6a 


N6-isopentenyladenosine 




mla 


'1 -methyl adenosine 




mif 


1 -methyl pseudouridine 




mig 


1-methylguanosine 




mil 


1-methylinosine 




m22g 


2,2-dimethylguanosine 




m2a 


2-methyladenosine 




rh2g 


2-methylguanos(ne 




m3c 


S-methylcytidine 




mSc 


S-methylcytidine 




m6a 


N6-methyiadenosine 




m7g 


7-methylguanosine 




mamSu 


5-methylaminomethyluridine 




mam5s2u 


5-methoxyaminomethyl-2-thiouridine 




man q 


beta, D-mannosylqueuosine 




mcm5s2u 


5-methoxycarbonylmethyl-2-thiouridine 




mcmSu 


5-meihoxycarbonylmethy!uridine 




mo5u 


5-methoxyuridine 




ms2i6a 


2-methylthio-N6-isopentenyiadenosine 




ms2t6a 


N-({9-beta-0-ribofuranosyl-2-methylthiopurine-6-yl)carbamoyl)threonine 




mt6a 


N-((9-beta-0-ribofuranosyIpurine-6-yl)N-methylcarbamoyl)lhreonine 




mv 


uridine-5-oxyacetic acid-methylester 




o5u 


uridine-5-oxyacetic acid 




osyw 


wybutoxosine 




P 


pseudouridine 
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Q 






z-iniocyiiuine 




o-meinyi-ii-in louriaine , 


-.Til 


2-thiour?dine 




^-iniouriQine 




3-rTieinyiuriui ne 


toa 


lN-uy-DGta*LJ-riuOrurano5y ipurine~o-yi j-caruarnoyi /ifireonine 


tm 


2'-0-methyl-5-methylLiridine 


um 


2'-0-methyiuridine 


yw 


wybutosine 


X 


3-(3-amino-3-carboxY-propyi)uridine, {acp3)u 



Table 3: List of Amino Acids 



Symbol 


Meaning 






Ala 


Alanine 






Cys 


Cysteine 






Asp 


AsparcicAcid 






Glu 


Glutamic Acid 






Phe 


Phenylalanine 






Gly 


Glycine 






His 


Histidine 


.. _— 




lie 


Isoleucine 






Lys 


Lysine 






Leu 


Leucine 






Met 


Methionine 






Asn 


Asparagine 






Pro 


Proline 






Gin 


Glutamine 






Arg 


Arg i nine 






Ser 


Serine 






Thr 


Threonine 






Val 


Valine 






Trp 


Tryptophan 






Tyr 


Tyrosine 






Asx 


Asp or Asn 






Glx 


Glu or Gin 






Xaa 


unknown or other 
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Table 4: List of Modified and Unusual Amino Acids 


Symbol 


Meaning 




Aad 


2'Aminoadipic acid 




bAad 


3-Aminoadipic acid 




bAla 


beta-Alanine, beta-Aminopropionic acid 




Abu 


2-Aminoburyric acid 




iiAbu 


4-AminobuTync acid, piperidinic acid 




Acp 


6-Aminocaproic acid 




Ahe 


2-Aminoheptanoic acid 




Aib 


2-Aminoisobutyric acid 




bAib 


3-Aminoisobutyric acid 




Apm 


2-Aminopimelic acid 




Obu 


2,4-OiaminobutYric acid 




Des 


Oesmosine 




0pm 


2.2'-Diaminopimelic acid 




Opr 


2,3-Diaminopropionic acid 




EtGly 


N-£thylglycine 




EtAsn 


N-Ethylasparagine 




Hyl 


Hydroxy lysine 




aHyl 


allo-Hydroxyiysine 




3Hyp 


3-Hydroxyproline 




4Hyp 


4-Hydroxyproline 




ide 


Isodesmosine 




alle 


allO'lsoleucine # 




MeGly 


N-Methylglycine, sarcosine 




Melle 


N-Methylisoleucine 




MeLys 


6-N-MethylIysine 




MeVal 


N-Methylvaiine 




Nva 


Nofvaline 




NIe 


Norleucine 




Orn 


Ornithine 
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Table 5: List of Featu 








allele 


a related individual or strain contains stable, alternative forms of the same gene which differs 
from the presented sequence at this location (and perhaps others) 




^ \} region or uinm atwnicn regulation or termination or transcription occurs, which controls the 
expression of some bacterial operons; 

{2) sequence segment located between the promoter and the first structural gene that causes 
partial termination of transcription 


C.regton 


constant region of immunoglobulin light and heavy chains, and T-ceil receptor alpha, beta, and 
gamma chains; includes one or more exons depending on the particular chain 


GAAT_signal 


CAAT box; part of a conserved sequence located about 75 bp up-stream of the start point of 
eukaryotic transcription units which may be involved in RNA polymerase binding; 
con sens us-=<jij or T) uAAiuT 




coding sequence; sequence of nucleotides that corresponds with the sequence of amino acids 
in a protein (location includes stop codon); feature includes amino acid conceptual translation 


conflict 


independent determinations of the "same" sequence differ at this site or region 




displacement loop; a region within mitochondrial DNA in which a short stretch of RNA is paired 
with one strand of DNA. displacing the original partner ONA strand in this region; also used to 
describe the displacement of a region of one strand of duplex DNA by a single stranded invader 
in the reaction catalyzed by RecA protein 


D-segment 


diversity segment of immunoglobulin heavy chain, and T-cell receptor beta chain 


enhancer 


a cis-acting sequence that increases the utilization of (some) eukaryotic promoters, and can 
function in either orientation and in any location (upstream or downstream) relative to the 
promoter 


exon 


region of genome that codes for portion of spliced mRNA; may contain 5'UTR, all CDSs. 
ana o u i n 


vJ L>_»>iy • lot 


GC box; a conserved GC-rich region located upstream of the start point of eukaryotic tran- 
scription units which may occur . in multiple copies or in either orientation; consensus=GGGCGG 


gene 


region of biological interest identified as a gene and for which a name has been assigned 




intervening UNA. una which is eiimmated through any of several kinds of recombination 


intron 


a segment of ONA that is transcribed, but removed from within the transcript by splicing 
togetner the sequences (exons) on either side of it 


J_segment 


joining segrnent of immunoglobulin light and heavy chains, and T-ce!l receptor alpha, beta, and 
gamma chains 


LTR 


long terminal repeat, a sequence directly repeated at both ends of a defined sequence, of the 
sort typically found in retroviruses 


TTiat_peptide 


mature peptide or protein coding sequence; coding sequence for the mature or final peptide or 
protein product following post-translational modification; the location does not include the stop 
codon (unlike the corresponding COS) 


nr»isc_binding 


site in nucleic acid which covalently or non-covalently binds another moiety that cannot be 
described by any other Binding key (primer_bind or protein.bind) 


misc_difference 


feature sequence is different from that presented in the entry and cannot be described by any 
other Difference key (conflict, unsure, old.sequence, mutation, variation, allele, or 

1 • IwUII ICU^UaoS/ 


misc_feature 


region of biological interest which cannot be described by any other feature key; a new or 
rare feature 


misc_recomb 


site of any generalized, site-specific or replicative recombination event where there is a 
breakage and reunion of duplex ONA that cannot be described by other recombination keys 
(lONA and virion) or qualifiers of source key (/insertion.seq, /transposon, /proviral) 



misc.RNA 


any transcript or RNA product that cannot be defined by other RNA keys (prim transcrinr 
precursor_RNA, mHNA, 5 clip, 3 clip, 5 UTR. 3'UTR. exon, CDS. sig peptide, transit Deotiri** 
mat^peptide. intron. polyA.site, rRNA, tRNA. scRNA. and snRNA) " ^ ' 


rnisc_signal 


any region containing a signal controlling or altering gene function or expression that cannot ha 
described by other Signal keys (promoter, CAAT signal, TATA.signal, -35_signal. -10 signal 
GC.stgnaL RBS, polyA_signal, enhancer, anenuator, terminator, and rep_origtn) 


misc.structure 


any secondary or tertiary structure or conformation that cannot be described by other ScrucrurA 
keys {stemjoop and D-toop) structure 


modified.base 


the indicated nucleotide is a modified nucleotide and should be substituted for by the indicated 
molecule (given in the mod_base qualifier value) 


mPlM A 


messenger RNA; includes 5' untranslated region (5'UTR), coding sequences (CDS, exon) and 
3' untranslated region (3'UTR) 


mucation 


a related strain has an abrupt, inheritable change in the sequence at this location 


1 N _ I I U 4 1 


extra nucleotides inserted between rearranged immunoglobulin segments 


oid_sequence . 


the presented sequence r^evises a previous version of the sequence at this location • 


polyA_signal 


recognition region necessary for endonuclease cleavage of an RNA transcript that is followed 
by poiyadenylation; consensussAATAAA 


poiyA site 


site on an RNA transcript to which will be added adenine residues by post-transcriptional 
poiyadenylation 


precursor^RNA 


any RNA species that is not yet the mature RNA product; may include 5' clipped region (5'clip), 
5' untranslated region (5'UTR), coding sequences (CDS, exon), intervening sequences (intron)/ 
3' untranslated region (3'UTR), and 3' clipped region (3'clip) 


orim rranscrint 


primary (initial, unprocessed) transcript; includes 5' clipped region (5'clip), 5' untranslated 
region (S'UTR), coding sequences (CDS, exon), intervening sequences (intron), 3' untranslated 
region (3'UTR), and 3' clipped region (3'clip) 


orim^r Hind 


non-coyaient primer binding site for initiation of replication, transcription, or reverse 
transcription; includes site(s) for synthetic, for example, PCR primer elements 


promoter 


region on a ONA molecule involved in RNA polymerase binding to initiate transcription 


protein^bind 


non-covalent protein binding site on nucleic acid 


RBS 


ribosome binding site 


repear_region 


region of genome containing repeating units 


repeat unit 


Single repeat element 


rep.origin 


origin of replication; starting site for duplication of nucleic acid to give two identical copies 


rRNA 


mature ribosomal RNA; the RNA component of the ribonucleoprotein particle (ribosome) which 
assembles amino acids into proteins 


S_region 


switch region of immunoglobulin heavy chains; involved in the rearrangement of heavy chain 
ONA leading to the expression of a different immunoglobulin class from the same B-cell 


satellite 


many tanaem repeats (identical or related) of a short basic repeating unit; many have a base 
composition or other property different from the genome average that allows them to be 
separated from the bulk (main band) genomic ONA 


scRNA 


small cytoplasmic RNA; any one of several small cytoplasmic RNA molecules present in the 
cytoplasm and (sometimes) nucleus of a eukaryote 


sig_peptide 


signal peptide coding sequence; coding sequence for an N-terminal domain of a secreted 
protein; this domain is involved in attaching nascent polypeptide to the membrane; leader 
sequence 


snRNA 


small nuclear RNA; any one of many small RNA species confined to the nucleus; several of the 
snRNAs are involved in splicing or other RNA processing reactions 
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source 


identifies the biological source of the specified span of the sequence- this kev is ^^^IZZl 1 
every entry w.ll have, as a minimum, a single source key spanning the entire sequence m^V^ 
than one source key per sequence is permissible ">ure 


stem_loop 


hairpm; a double-heiical region formed by base-pairing between adjacent (inverted) 
complementary sequences in a single strand of RNA or ONA 


STS 


Sequence Tagged Site; short, single-copy DNA sequence that characterizes a mapping 
landmark on the genome and can be detected by PGR; a reqion of the aenome can hp m^or^c*^ 
by determining the order of a series of STSs ^ 


TATA_signal 


TATA box; Goldberg-Hogness box; a conserved AT-rich septamer found about 25 bp before the 
start point of each eukaryotic RNA polymerase li transcript unit which may be involved in 
positioning the enzyme for correct initiation; consensus^TATA(A or T)A(A or T) 


terminator 


sequence of DNA located either at the end of the transcript or adjacent to a promoter region 
that causes RNA polymerase to terminate transcription; may also be site of binding of reoressor 
protein 


transit_peptide 


transit peptide coding sequence; coding sequence for an N-terminai domain of a nuclear- 
encoded organellar protein; this domain is involved in post-translationa! import of the protein 
into the organelle 


tRNA 


mature transfer RNA, a small RNA molecule (75-35 bases long) that mediates the translation of 
a nucleic acid sequence into an amino acid sequence 


unsure 


author is unsure of exaa sequence in this region 


V_region 


variable region of immunoglobulin light and heavy chains, and T-cell receptor atpha, beta, and 
gamma chains; codes for the variable amino terminal portion; can be made up from 
V_segments, O^segments, N_regions, and J.segments 


V_segment 


variable segment of immunoglobulin light and heavy chains, and T-ceM receptor alpha, beta, 
and gamma chains; codes for most of the variable region (V_region) and the last few amino' 
acids of the leader peptide 


variation 


a related strain contains stable mutations from the same gene (for example, RFLPs, polymor- 
phisms, etc.) which differ from the presented seauence at this location (and nn<5^ihi\/ ntharci 


3'clip 


3'-most region of a precursor transcript that is clioDed off durina orocessina 


3'UTR 


region at the 3' end of a mature transcript (following the stop codon) that is not translated 
into a protein 


5'dip 


5'-most region of a precursor transcript that is clipped off during processing 


5*UTR 


region at the 5' end of a mature transcript (preceding the initiation codon) that is not translated 
into a protein 


-10_signal 


ijiiunow oox, a conservea region aoout 10 bp upstream of the start point of bacterial 
transcription units which may be involved in binding RNA polymerase; consensus^TAtAaT 


-35_signal 


a conserved hexamer about 35 bp upstream of the start point of bacterial transcription units* 
consensus=TTGACa [ ] or TGTTGACA [1 
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Table 6: List of Feature Keys Related to Protein Sequences 



Key 


Description 


CONFLICT 


different papers report differing sequences 


VARIANT 


authors report that sequence variants exist 


VARSPUC 


description of sequence variants produced by alternative splicing 


MUTAGEN 


site which has been experimentally altered 


MOO.RES 


posT-transiationai modification of a residue 


ACETYLATION 


N-terminal or other 


AMIDATION 


generally at the C-terminal of a mature active peptide 


BLOCKED 


undetermined N- or C-terminal blocking group 


FORMYLATION 


of the N-terminai methionine 


GAMMA- 

CARBOXYGLUTAMIC 
ACID HYDROXYLATION 


of asparagine. aspartic acid, proline ar lysine 


METHYLATION 


generally of lysine or arginine 


PHOSPHORYLATION 


of serine, threonine, tyrosine, aspartic acid or histidine 


PYRROUDONE 
CARBOXYLIC ACID 


N-terminal glutamate which has formed an internal cyclic lactam 


SULFATATION 


generally of tyrosine 


LIPID 


covalent binding of a lipidic moiety 


MYRISTATE 


myristate group attached through an amide bond to the N-terminal glycine residue of 
the mature form of a protein or to an internal lysine residue 


PALMITATE 


palmitate group attached through a thioether bond to a cysteine residue or through 
an ester bond to a serine or threonine residue 




farnesyl group attached through a thioether bond to a cysteine residue 


GERANYL-GERANYL 


geranyl-geranyl group attached through a thioether bond to a cysteine residue 


GPl-ANCHOR 


glycosyl-phosphatidylinositol (GPI) group linked to the alpha-carboxyl group of the 
C-terminal residue of the mature form of a protein 


N-ACYL OIGLYCERiDE 


N-terminal cysteine of the mature form of a prokaryotic lipoprotein with an amide- 
linked fatty acid and a glyceryl group to which two fatty acids are linked by ester 
linkages 




disulfide bond; the FROM and TO endpomts represent the two residues which are 
linked by an intra-chain disulfide bond; if the 'FROM' and TO' endpoints are identical, 
the disulfide bond is an interchain one and the description field indicates the nature 
of the cross-link 




thiolester bond; the FROM and TO endpomts represent the two residues which are 
linked by the thiolester bond 


THIOETH 


thioether bond; the 'FROM' and TO' endpoints represent the two residues which are 
linked by the thioether bond 


CARBOHYD 


glycosyfation site; the nature of the carbohydrate (if known) is given in the description 
field 


METAL 


binding site for a metal ion; the description field indicates the nature of the metal 


BINDING 


binding site for any chemical group (co-enzyme, prosthetic group, etc.); the chemical 
nature of the group is given in the description field 
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SIGNAL 




TRANSIT 


eALciu Kji a ifdiiiii (jc^iiuc \i tiiiocnonansi, cnioropiastic, or for 3 microoodv) 


PROPEP 


exten: of a propeptide 


CHAIN 


extent of a polypeptide chain in the mature protein 


PEPTIDE 


extent of a released active peptide 


DOMAIN 


extent of a domain of interest on the sequence; the nature of that domain is given in 
the description field 


CA.BIND 


extent of a calcium-binding region 


DNA,BIND 


extent of a DNA-binding region 


NP.BIND 


extent of a nucleotide phosphate binding region; the nature of the nucleotide 
phosphate is indicated in the description field 


TRANSMEM 


extent of a transmembrane region 


ZN.FING 


extent of a zinc finger region 


SIMILAR 


extent of a similarity with another protein sequence; precise information, relative to 
that sequence is given in the description field 


REPEAT 


extent of an internal sequence repetition 


HELIX 


secondary structure: Helices, for example. Alpha-helix. 3(10) helix, or Pi-helix 


STRAND 


secondary structure: Beta-strand, for example. Hydrogen bonded beta-strand, or 

nesiQUS in an (z»ufaicu utSLd-uriu^e 


TURN 


Scconaary siruuiure turns, ror example, M-oonaeu turn \o-turn, **-turn or D-iurn^ 


ACT.SITE 


amino acid(s) involved in the activity of an enzyme 


SITE 


any other interesting site on the sequence 


INIT.MET 


the sequence is known to start with an initiator methionine 


NON.TER 


the residue at an extremitv of the se^iu^nf^p nc^t the terminal r^^ldu^' if anoli^d tQ 
position 1, this signifies that the first position is not the N-terminus of the complete 
molecule; if applied to the last position, it signifies that this position is not the * 
C-terminus of the complete molecule; there is no description field for this key 


NON.CONS 


non consecutive residues; indicates that two residues in a sequence are not 
consecutive and that there are a number of unsequenced residues between them 


UNSURE 


uncertainties in the sequence; used to describe region(s) of a sequence for which the 
authors are unsure about the sequence assignment 
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Appendix 3 



Specimen sequence listing 










< i. > 


Smich. John; Smichgene Inc . 










< L - u > 


Example of a Sequence Liscing 








< L J u > 


Oi-00001 










<L40> 
<I4L> 


PCT/E?9a/00001 
1998-12-31 










T C 

<L5I> 


as 08/999 999 
L997-10-15 










< 150> 


4 










< 170> 


Pacencln Version 2.0 










<210> 
<211> 
<212> 
<2i3> 


1 

389 
DMA 

Paramecium sp . 










<220> 
<221> 
<222> 


CDS 

(279) (389) 










^ 1 n n ■> 

< J u u > 
<30i> 
^ 1 n 9 -* 

< J U J > 

<304> 

< J U J > 

<306> 

<308> 
<309> 


Doe, Richard 

Isolacion and Characcarizacion of a Gene Encoding a 

from Paramecium sp. 

Journal of Genes 

1 

4 

1-7 

1988-06-.31 

123456 

1983-06-31 


Procease 




<400> 


1 










agccgcagcc 


acccccgcgc cccccccccc 


ccgggccccc 


caccccgcca 


accagacccc 


60 


agggagagcg 


ccccgacccc cccccgcccc ' 


cgcagcccca 


caggcaggca 


ggcaggcagc 


120 


cgacgcggca 


accgccggca gcgccacagg 


ccccccagcc 


aggcccaggg 


cgggceccgc 


180 


cgcggcgcgg 


cggccccccc cgcgcccccc 


ccgcgccccc 


cccccgcccc 


ccccccgccc 


- 240 


ggacccgacc 


aggcgagcag gaggaggggg 


cage cage 


acg gcc cca 
Mec Val Ser 
1 


acg ccc age 
Mec, Phe Ser 


29 6 


ccg ccc 
Leu Ser 


ccc aaa egg ccc gga ccc 
Phe Lys Trp Pro Gly Phe 
10 


cgc ccg 
Cys Leu 
15 


ccc gcc cgc 
Phe Val Cys 


ccg ccc caa 
Leu Phe Gin 
20 


344 


cgc ccc 
Cys Pro 


aaa gcc ccc ccc cgc cac 
Lys Val Leu Pro Cys Kis 
25 30 


cca cca 
Ser Ser 


ccg cag ccg 
Leu Gin Pro 
35 


aac ccc 
Asn Leu 


339 
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<2L0> 2 

<2ll> 37 - 

<212> PRT 

<213> , Paramecium sp . 

<400> 2 

Mec Val Ser Mec ?he Ser Leu Ser Phe Lys Tro Pro Civ Phe Cys Leu- 
15 10 "is 

Phe vai Cys Leu ?he Glr. Cys Pro Lys Val Leu Pro Cvs His Ser Ser 
20 25 * 30 

Leu Gin Pro Asn Leu 
35 

<21Q> '3 
<211> 11 

<212> PP.T ' 

<213> Aruificial Sequence 

<22Q> 

<.22 3> Designed pepcide based on size and polar icy co acc as a linker berween che 

alpha and beca chains of Procein XYZ 

<400> 3 

Mec Val Asn Leu *Glu Pro Mec His Thr Giu lie 
1 . 5 10 



1/1998. 



<210> 
<400> 
000 



4 
4 
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Appendice 1 

Identificateurs numeriques 

Seuls tes identificateurs numeriques 
definis ci-apres peuveni etre utilises 
dans les listages de sequences 
soumis avec les demandes. Le texte 
des en-tetes d'elements de donnees 
indiques ne doit pas figurer dans 
les listages. 



Les identificateurs numeriques des 
elements de donnees obligatoires, 
c'est-a-dire les elements de donnees 
qui doivent imperaiivement frgurer 
dans les listages de sequences (voir 
ie paragraphe 25 de la presente 
norme : identificateurs 110, 120, 160 
210. 211, 212, 213 et 400), et les 
identificateurs numeriques des' 
elements de donnees qui doivent 
imperativement etre indiques dans 



les C3S mentionnes dans la presente 
norme (voir les paragraphes 26 27 
23, 29 et 30 de la presente norme • ' 
identificateurs 130. UQ, ^so et 
151 et 220 a 223). sont signales par la 
leftre "O". 

Les identificateurs numeriques des 
elements de donnees facultatifs 
(voir le paragraphe 31 de la presente 
norme) sont signales par la lenre "F". 



Identificateur 
numerique 


Descnpttan de 
Tidentific^teur numerique 


Obligatoire (O) ou 
facultatif (F) 


Observations 


<no> 


Nom du deposant 


0 


lorsque le nom du deposant est ecrit 
dans des ca'racteres qui ne sont pas 
ceux de I'alphabet tatin, ii convient de 
I'ecrire a I'aide de cet alphabet, sous la 
forme d'une simple translitteration ou 
d'une traduction en anglais 


<120> 


Titre de ('invention 


0 




<130> 


Reference du dossier 


0, dans les cas mentionnes 
au paragraphe 26 de la 
presente norme 


voir le paragraphe 26 de la presente 
norme 


<U0> 


Demande de brevet actuelle 


0, dans les cas mentionnes 
au paragraphe 27 de la 
presente norme 


voir le paragraphe 27 de la presente 
norme ; la demande de brevet actuelle 
doit etre designee au moyen des ele- 
ments ci-apres, dans I'ordre qui suit : le 
code a deux lenres indique conforme- 
ment a la norme ST.3 de I'OMPI et le 
numero de la demande (sous le format 
de numerotation utilise par I'office 
de propriete industrielle aupres duquel 
la demande de brevet actuelle est 
deposee) ou, pour une demande Inter- 
nationale, le numero de demande 
Internationale 


<141> 


Date de depot de la 
demande actuelle 


0, dans les cas mentionnes 
au paragraphe 27 de la 
presente norme 


voir le paragraphe 27 de la presente 
norme ; la date doit etre indiquee 
conformement a la norme ST.2 de 

1 UMrl (LL.YY iwiNl UUJ 


<150> 


Demande de 
brevet anterieure 


\j , uai Id led K^a^ 1 1 ici 1 Liunnes 

au paragraphe 28 de la 

pr sscnic no r m e 


voir le paragraphe 28 de la presente 
norme ; la demande de brevet anterieure 
doit etre designee au moyen des ele- 
ments ci-apres, dans I'ordre qui suit ; le 
code a deux lettres indique conforme- 
ment a la norme ST.3 de I'OMPI, et le 
numero de la demande (sous le format 
de numerotation utilise par I'office de 
propriete industrielle aupres duquel la 
demande de brevet anterieure a ete 
deposee) ou, pour une demande Inter- 
nationale, le numero de demande 
Internationale 


<151> 


Date de depdt de.Ia 
demande anterieure 


0, dans les cas mentionnes 
au paragraphe 28 de la 
presente norme 


voir le paragraphe 28 de la presente 
norme ; la date doit etre indiquee 
conformement a la norme ST.2 de 
rOMPI (CCYY MM OD) 


<160> 


Nombre de SEQ ID NO 


0 




<170> 


Logiciel 


F 




<210> 


Information concernant 
SEQ ID NO : X 


0 


nombre entier representant la sequence 
SEQ ID NO 
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<2n> 



Longueur 



la longueur de la sequence est exprirnee 
en nombre de paires de bases ou 
d'acides amines 



<212> 



Type 



cype de molecule sequencee dans SEQ 
ID NO : X, soic ADN. soit ARN, soit PRT ; 
si une sequence de nucleotides contien't 
a la fois des fragments d'AON et des 
fragments d'ARN, la valeur sera 
"ADN"; en outre, la molecule combinee 
ADN/ARN sera decrite egalement dans 
les identificateurs <220> a <223>, sous 
Caracteristique. 



<213> 



Organisms 



espece (nom scientifique) ou Sequence 
artificielle ou Non connu 



=220> 



Caracteristique 



O, dans les cas mentiohnes 
aux paragraphes 29 et 30 
de la presente norme 



laisser en blanc ; voir les paragraphes 29 
et 30 de la presente norme ; description 
des points ayant une importance biolo- 
gique dans la sequence SEQ ID NO : x 
(peut etre repetee en fonction du 
nombre des caracteristiques indiquees) 



<221> 



Nom/cle 



O, dans les cas mentionnes 
au paragraphs 29 de la 
presente norme 



voir le paragraphs 29 de la presente 
norme ; seules doivent etre uti'Iisees les 
cles decrites dans les tableaux 5 ou 6 de 
I'appendice 2 



<222> 



Emplacement 



O, dans les cas mentionnes 
au paragraphs 29 de la 
presente norme 



voir le paragraphe 29 de ta presente 
norme ; 

- de (numero de la premiere base 
ou du premier acide amine dans la 
caractsristique) 

- a (numero de la derniere base 
ou du dernier acide amine dans la 
caracteristique) 

- paires de bases (numeros des posi- 
tions des paires de bases dans une 
sequence de nucleotides) 

- acides amines {numeros des positions 
des residus d'acides amines dans une 
sequence d'acides amines) 

- lorsque la caracteristique se situe sur 
un brin complementaire de celui 
figurant dans !e Itstage des sequences 



<223> 



Autres informations 



O, dans les cas mentionnes 
aux paragraphes 29 et 30 
de la presente norme 



voir les paragraphes 29 st 30 ds la pre- 
sente norme ; touts autre information 
pertinents, exprirnee a I'aide du vocabu- 
iaire non connote ou sous forme de 
texts libre (de preference en anglais) ; 
tout texts libre doit etre repete dans la 
partie principals de la description, dans 
ta meme langue (voir le paragraphs 36 
ds la presente norme) ; lorsqu'une base 
modifiee ou un acide amine modifie ou 
peu connu figurant dans les tableaux 2 
et 4 de I'appendice 2 est utilise dans 
la sequence, il convient d'utiliser le 
symbole associe a cette base ou a cet 
acide amine des tableaux 2 et 4 de 
I'appendice 2 



<300> Informations concernant 

la publication 



laisser en blanc ; a repeter pour chaque 
publication pertinents 



<301> 



Auteurs 



<302> 
<303> 



litre 



titre de la publication 



Periodique 



pericdique dans lequsl les donnees ont 
ets publiees 
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<30-i> 


Volume 


F 


volume du bulletin officiel dans lequel 
les donnees ont ete publtees 


<305> 


Numero 


F 


numero du periodique dans lequel les 
donnees ont ete publiees 


<306> 


Pages 


F 


numero des pages du periodique dans 
lequel les donnees ont ete publiees 


<307> 


Date 


F 


date de parution du periodique dans 
lequel les donnees ont ete publiees ; si 
nrt^<5ihlp la riats doit errp inrlimip^ 
conformement a la norme ST.2 de 
rOMP! (CCYY MM DO) 


<308> 


Numero d'entree dans 
ta base de donnees 


F 


numero d'entree artribue par la base de 
donnees, y compris nom de cette base 
de donnees 


<309> 


Date d'entree dans 
la base de donnees 


F 


date d'entree dans la base de donnees ; 
fa date doit etre indiquee conforme- 
ment a ta norme ST.2 de.i'OMPl 
(CCYY MM DO) 


<310> 


Numero du document 


F 


numero du document, uniquement pour 
les citations de brevets ; le document 
complet doit corriprendre, dans I'ordre : 
le code a deux lertres indique conforme- 
ment a la norme ST.3 de I'OMPI, le 
numero de publication rndique confor- 
mement a la norme ST.6 de I'OMP! et le 
code de type de document indique con- 
formement a la norme ST.16 de I'OMPt 


<3n> 


Date de depot 


F 


date de depot du document, unique- 
ment pour les citations de brevets ; ia 
date doit etre indiquee conformement a 
la norme ST.2 de I'OMPI (CCYY MM DO) 


<312> 


Date de publication 


F 


date de publication du document, 
uniquement pour les citations de 
brevets ; !a date doit etre indiquee 
conformement a la norme ST.2 de 
I'OMPI (CCYY MM DO) 


<313> 


Residus pertinents 
dans ScQ ID NO : X 


F 




<^00> 


Sequence 


O 


le SEQ ID NO : x doit suivre I'identifica- 
teur numerique et figurer sur la ligne 
precedent la sequence (voir i'appen- 
dice 3) 
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Symboles des nucleotides et des acides amines et tableau des 
Tableau 1 : Uste des nucleotides 
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caracteristiques 



Symbole 


Signification 


Origine de la designation 


a 


a 


adenine 


g. 


g 


guanine 


c 


c 


cytosine 


t 


t 


thymine 


u 


u 


uracile 


r 


g ou a 


purine 


y 


t/u ou c 


p^rimidine 


m 


a ou c 


amino 


k 


g ou t/u 


keto (Ceto) 


s 


g ou c 


interactions forces (liaisons 3 H) 


w 


a ou t/u 


interactions faibles (liaisons 2 H) 


b 


g ou c ou t/u 


autre que a 


d 


a ou g ou t/u 


autre que c 


h 


a ou c ou t/u 


autre que g 


V 


a ou g ou c 


autre que t et u 


n 


a, g, c ou t/u, non connu. ou autre 


n'imporce lequel 
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Tableau 2 : liste des nucleotides modifies 



1 f 

oymbaie 


Signification 




ac4c 


4-acetylcytidine 




chmSu 


SMcarboxyhydroxymethyOuridine 




cm 


2'-0-methylcyTidine 




cmnm5s2u 


5-carboxymethyiaminomethyl-2-thiouridine 




cmnmSu 


5-carboxymethylaminomethyluridine 




d 


dthydrouridine 




fm 


2'-0-meihylpseudouridine 




gal q 


beta, 0-galactosylqueu6sine 






2'-0-mechylguanosine 




i inosine 


i€a 


N6-isopentenyladenosine 




mla 


1-methyladenosine 




mif 


1-mechylpseudouridrne 




mlg 


1-methyiguanosine 




m 1 i 


1-methyiinosine 




m22g 


2,2-dimethylguanosine 






2*methyladenosine 




rn2g 


2-methylguanosine 




m3c 


3-methylcytidine 




m5c 


5-methylcytidine 




m6a 


N6-methyladenosine 




m7g 


7-methylguanosine 




mamSu 


5-methyIaminomethyturidine 




mam5s2u 


5-methoxYaminomethyl-2-thiouridine 




man q 


beta, D-mannosylqueuosine 




mcm5s2u 


5-methoxycarbonylmethyl-2-thiouridine 




mcmSu 


5-methoxycarbonylmethyluridine 




moSu 


5-methoxyuridine 




ms2i6a 


2-methylthio-N6-isopentenyladenosine 




ms2t6a 


N-{{9-beta-0-ribofuranosyl-2-methylthiopurine-6-yi) carbamoyl) threonine 




mt6a 


N-{{9-b5ta-D-ribofuranosyipurine-6-yON-methylcarbamoyI) threonine 




mv 


S-methoxycarbonylmethoxyuridine 




o5u 


5-carboxymethoxyuridine 




osyw 


>Ar/butoxosine 
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p 


pseudouridine 






q 


queuosine 






s2c 


2-thiocytidine 






s2t 


5-nriethyl-2-thioundine 




■ 


s2u 


2-thiouridine 






s^u 


4-thiouridine 






t 


5-methyluridine 






t6a 


N-((9-beta-0-ribofuranosyipurine-6-yl)-carbamoyl) threonine 






tm 


2'-0-rnethyl-5-methyluridine 




■ 


um 


2'-0-methyiuridine 






yw 


wybutosine 






X 


3-{3-amino-3-carboxypropyi)uridine, (acp3)u 






Tableau 3 : 


liste des acides amines 






Symbote 


Signification 






Ala 


Alanine 






Cys 


Cysteine 






Asp 


Acide aspartique 






Glu 


Acide glutamique 






Phe 


Phenylalanine 






Gly 


Glycine 






His 


Histidine 






lie 


Isoleucine 






Lys 


Lysine 






Leu 


Leucine 






Met 


Methionine 






Asn 


Asparagine 






Pro 


Proline 






Gin 


Giutamine 






Arg 


Arginine 






Ser 


Serine 






Thr 


Threonine 






Va! 


Valine 






Trp 


Tryptophane 






Tyr 


Tyrosine 






Asx 


Asp ou Asn 






Glx 


Glu ou Gin 






Xaa 


non connu ou autre 
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Tableau 4 : liste des acides amines modifies ou peu connus 



Symbole 


Signification 




Aad 


acide 2-aminoadipique 




bAad 


acide 3-aminoadipique 




bAla 


beta-alanine, beta-acide aminopropionique 




Abu 


acide 2-aminobutyrique 




4Abu 


acide 4-aminoburyrique, acide piperidinique 




Acp 


acide 6-aminocapro7que 




Ahe 


acide 2-am/noheptanoyque 




Aib 


acide 2-aminoisobutvrique 




bAib 


acide 3-aminoisobutyrique 




Apm 


acide 2-aminopimelique 




Dbu 


acide 2.4-diaminobutynque 




Des 


desmosine 




0pm 


acide 2.2'-diaminopimeHque 




Dpr 


acide 2,3-diaminopropionique 




EtGIy 


N-ethylgiycine 




EtAsn 


N-ethyiasparagine 




Hyl 


hydroxylysine 




aHyl 


allo-hydroxylysine 




3Hyp 


S-hydroxyproline 




4Hyp 


4-hydroxYproiine 




Ide 


isodesmosine 




alle 


allo-isoleucine 




MeGIy 


N-methylglycine, sarcosine 




Melle 


N-methyliso!eucine 




MeLys . 


6-N-methy!lysine 




MeVal 


N-methyivaiine 




Nva 


non/aline 




NIe 


norleucine 




Orn, 


ornithine 
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Tableau 5 : Iiste des cles de caracterisation concernant les sequences de nucleotides 



Cle 


Description 


allele 


individu ou souche apparente contenant des formes stables differentes d'un meme gene, qui se 
distingue de la sequence presentee a cet emplacement (et eventuellement a d'autres*. 
emplacements) 


attenuator 


1) region d'ADN ou se produit une regulation de la terminaison de la transcription qui controle 
{'expression de certains operons bacteriens ; 

2) segment de sequence situe entre le promoteur et le premier gene de structure, qui provoque 

uns t&rminai^rto narrialla Ho la tra o Qr*ri' ntl on 


C_region 


region constante de la chaine lourde et de la chaine legere de Timmunoglobuline et des chames 
alpha, beta et gamma du recepteur d'un lymphocyte T ; comprend un ou plusieurs exons, selon 
la chaine 


CAAT_si'gnal 


sequence CAAT ; panie d'une sequence conservee situee environ 75 paires de bases en amont 

du site d't r^iftprif^n Hac imiroc Ho trsn^rriotion Ptipsrv/^^toc mii naiit If^tn^r im rAto Hane la fivatir^o 

de I'ARN polymerase ; consensus=GG (C ou T) CAATCT 


CDS 


sequence codante C^oiing sequence") ; sequence de nucleotides correspondant a celte des 
acides amines dans une proteine ({'emplacement comprend le codon d'arret) ; contient la 

tradud^ion fonr^ootiiollo Hoc afiHfl>c aminp^ 


conflict 


les determinations independantes de la ''meme'*sequence different sur ce site ou dans cette 
region — . 


D-Ioop 


boucle de deplacement ("displacement loop") ; region au sein de I'ADN mitochondrial ou une 
petite partie d'ARN est appartee a un brin d'ADN, entramant le deplacement du brin original 

d'ADN dan^ cp^tT^ roni^^n • H*a^Irtnp ;ifj*5^i le rienlj^pem Ant H'limo ro/^i/M-» H'AP^M Hr*iiKIo Krio 

t'effet d'un envahisseur simple brin dans la reaction catalysee par la proteine RecA 


D-segment 


Seoment de diver^iTP /"Hiv/pr^itv ^pampnt'*^ de la phaTne irinrHo Ho I'lmnrM mrtj^l/^hi i(mo oT Hp la 

chaine beta du recepteur d'un lymphocyte T 


enhancer 


sequence en cis entramant Tutilisation accrue de (certains) promoteurs eucaryotes et dont 
Taction s'exerce auelle aue soit I'orientation et remoiacement (en amont nu en aval) oar 
rapport au promoteur 


exon 


reaion du Genome codant une oartie de I'ARN messaoer eois^p • net it rrknt^ntr la rection S'UXR 
tous les CDS et la region 3'UTR 


GC_signa! 


sequence GC ; region conservee riche en GC, situee en amont du site d'initiation des unites de 
transcription eucaryotes, qui peut prendre la forme de copies multiples et se produire dans les 
deux sens * cnn^pnQitc-f^nf^Pnri 


gene 


region presentant un interet bioiogique, identifiee comme etant un gene et a laquelte un nom a 
ete attribue 


IDNA 


ADN intercalaire ; ADN elimine par Tun des types de recombinaison. 


intron 


segment d'ADN qui est transcrit. puis elimine par aboutement des sequences (exons) situees de 
part et d'autre 


J_segment 


segment de ionction Cioinina searnent'') de la chaine leaere et de la chaine Inurde de I'immu- 
noglobuline, ainsi que des chaTnes alpha, beta et gamma du recepteur d'un lymphocyte T 


LTR 


repetition terminale lonque Clona terminal reoeat") * seauence directement reoetee aux 
deux extremites d'une sequence definie, du type de celie que Ton trouve dans les retrovirus 


mat_peptide 


sequence codante d'un peptide mature ou d'une proteine mature ; sequence codante du 
peptide ou de la proteine a I'etat mature ou final, qui suit la modification post-traductionnelle ; 
I'emplacement ne comprend pas le codon d'arret (contrairement au CDS correspondant) 


misc_binding 


site d^un acide nucieique fixant, par covalence ou non, un autre fragment de molecule, qui ne 
peut etre decrit par aucune autre cle de fixation {primer^bind ou protein_bind) 


misc.difference 


sequence de caracterisation differente de ce!Ie qui est presentee dans I'entree et ne pouvant pas 
etre decrite par une autre cle de difference (conflict, unsure, old sequence, mutation, variation, 
allele ou modified_base) 


misc.feature 


region presentant un interet bioiogique, qui ne peut pas etre decrite par une autre cle de 
caracterisation ; nouvelle caracteristique ou caracteristique rare 
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misc,recomb 


site de toute recombmarson generalisee. specifique d'un site ou replicative. ou se produit la 
cassure ec la reunion de TAON double brin et qui ne oeut oas etre decrirp nar unp aurrp rio h« 
recombinaison (iONA ou virion) ou par un autre qualificateur de cle source (/insertion seq 
/transposon, /provtral) ~ 


misc_RNA 


tout transcnt ou produit de TARN qui ne peut pas etre defini par une autre cle de I'ARN 
(pnm_transcript, precursor RNA. mRNA, S'clio, 3'cfiD 5'UTR 3'UTn Pvnn Cn^ «;in nPnfiHo 
lransit,peptide. mat_peptide, intron. polyA_site, rRNA, tRNA, scRNA ou snRNA) 


misc_signal 


toute region contenant un sianal oui commande nu mnHifiP imp frsr\nr\nn mt rovnroc<;inn 
d'un gene, qui ne peut pas etre decrite par une autre cle de signal (promoter, CAAT_signal, 
TATA.signal, -35_signal. -lO.signal, GC.signal, RBS, poIyA.signal, enhancer, anenu"ator. 
terminator ou rpn orinin\ 


misc_srrucTure 


toute structure ou conformation secondaire ou tertiaire qui ne peut pas etre decrite par une 

autre cle de Strii**Tiirci /ctpm lo*^r\ r\tt r^-lrtriol 


modified_base 


le nucleotide indique est un nucleotide modifie, qui doit etre remplace par la molecule indiquee 
(donnee dans la valpur nualifirafivp mod base) 


mRNA 


ARN messager ; comprend la region non traduite en 5' (5'UTR), les sequences codantes (CDS,, 
exon) et la reoion non traduite en 3' (3'LITRl 


mutation 


la SOUCne aooarentpp nrf^^t^nt^ im fH^napmpnt Hrii^ntiP pr rrancp<rtif c^iKia M-^nc la e^/^iianr'a 

a cet emplacement 


N_region 


des nucleotides suoolementaires sont inseres entre dp^ ^pnmpnt<: ri'immi mnoinhiiiind 
rearranges 


o(d_sequence 


la sequence oresentee est la version modifiee d'une ancipnnp ^potipnf*p a f*pr pmniarpmpnt 


polyA_stgnai 


site de reconnaissance indispensable a la coupure d'un transcrit par endonuclease, suivie d'une 
polyadenylation ;consensus=AATAAA 


polyA^site 


site d'un transcrit auquel sont ajoutes des residus d'adenine par polyadenylation 
post-transcriptionnelie ^ - 


precursor_RNA 


ARN precurseur, c'est-a-dire tout type d'ARN qui n'est pas encore mature ; peut comprendre la 
region coupee en 5' (5'clip), la region non traduite en 5' (5'UTR), les sequences codantes (CDS, 
expn), les sequences intercalaires (intron), la region non traduite en 3' (3'UTR) et la region 
coupee en 3' (3'clip) 


pnm_transcript' 


transcrit primaire (initial, non remanie) ; comprend la region coupee en 5' (S'clip), la regiorn non 
traduite en 5' (5'UTR), les sequences codantes (CDS, exon), les sequences intercalaires (intron), 
la region non traduite en 3' (3'UTR) et la region coupee en 3' (3'ciip) 


primer^bind 


site de fixation non covalent pour amorces dans I'initiaiion de la replication, de la transcription 
ou de la transcription inverse ; comprend les sites pour les elements de synthese, par exemple 
les amorces de I'amplification en chame par polymerase (PCR) 


promoter 


''egjon d'une molecule d'ADN jouant un role dans la fixation de I'ARN polymerase en vue de 
I'initiation de la transcriotion 


proteln^bind 


Site de fixation nnn f*n\/3lpnf Hp<s r^mTi»tryt>^ ^iir itn ar*lHo mi^lat^^rtA 


RBS 


site de fixation du ribosome ("ribosome jjinding site") 


repeat.region 


region du genome contenant des unites de repetition 


repeat_unit 


unite d'un element de repetition 


rep.origin 


origine de la replication ; site de depart pour la duplication d'un acide nucleique en vue de 
I'obtention de deux copies identiques 


rRNA 


ARN ribosomique mature ; molecule d'ARN de ta parcicule ribonucleoproteique (ribosome) qui 
assemble les acides amines en proteines 


S_region 


region de commutation ("switch region") des chaines lourdes de Timmunoglobuline ;ioue un 
role dans le rearrangement de la chaine lourde de I'ADN, qui conduit a ['expression d'une 
classe d'immunoglobuline differente a parcir du meme lymphocyte B 


satellite 


nornbreuses sequences repetees en tandem (identiques ou apparentees) d'une courte unite de 
repetition de base ; nombre d'entre elles ont une composition de base ou une propriete 
differente de la moyenne du genome, qui ieur permet d'etre separees du reste de I'ADN 
genomique (bande principale) 
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scRNA 


S^ADM^'^ cytoplasmrque {"small cytoplasmic RNA") ; I'une des nombreuses petites molecules 
d AHN cytoplasmique presentes dans le cytoplasme et (parfois) dans le noyau d'un eucarvote 


o 1 ^ _ c p L 1 0 C 


sequence codante d'un peptide-signal ; sequence codance d'un N-terminal de proceine secre- 
tee ; ce domaine joue un role dans I'integration du polypeptide naissant dans la membrane • 
sequence leader 


snniN A 


petit AHN nucieaire ( small nuclear RNA ) ; ( une des nombreuses petites especes d'ARN 
conftnees au noyau ; plusieurs snRNA jouent un role dans I'excision-epissage ou dans d'autres 
reactions de maturation moleculaire de I'ARN 


sou rce 


permet d'identifier la source biologique de I'interv/alle de sequence indique ; cene cle est 
obligatoire ; chaque entree doit comporter, au minimum, une cie source unique couvrant la 
sequence tout entiere ; ii est possible d'utiliser plus d'une cle source par sequence 


stem_loop 


epmgle a cheveux ; region d'une double helice formee par I'appariement de bases entre des 
sequences contigues (inversees) compiementaires appartenant a un meme brin d'ARN ou 
d'ADN 


STS 


site de sequence etiquete ; sequence d'ADN courte et unique caracterisant un point de repere 
de la carcographie du genome et qui peut etre detectee moyennarrt une amplification en chame 
par polymerase (PGR) ; la carte d'une region du genome peut etre dressee par determination de 
I'ordre d'une serie de STS 


1 v'-N t i ^ n 0 1 


sequence lAiA , sequence de Goldberg-Hogness ; heptamere conserve, riche en A etT, situe 
environ 25 paires de bases en amont du site d'initiation de chaque unite transcrite par I'ARN 
polymerase II des eucaryotes, qui peut jouer un role dans le positionnement de I'enzyme aux 
fins d'une initiation correcte ; consensus=TATA(A ou T)A(A ou T) 


terminator 


sequence d'ADN situee soil a I'extremite du transcrit, soit a cote d'un promoteur qui conduit 
I'ARN polymerase a terminer la transcription ; peut aussi etre le site de fixation d'un represseur 


transit_peptrde 


sequence codante d'un peptide-transit ; sequence codante d'un N-terminal de proteine d'un 
organite codee par le noyau ; ce domaine joue un role dans I'importation post-traductionnelle 
de ta proteine dans I'organite ' 


tRNA 


ARN de transfert mature ; courte molecule d'ARN (75-85 bases) qui permet la traduction d'une 
sequence d'acides nucleiques en une sequence d'acides amines 


unsure 


I'auteur n'est pas certain de Texactitude de la sequence dans cette region 


V_region 


region variable de la chaine legere et de la chaine lourde de rimmunoglobuline et des chaines 
alpha, beta et gamma du recepteur d'un lymphocyte T ; codes applicables a la portion variable 
du terminal amino ; peut etre composee des segments suivants : V segments, D segments, 
N_regions et J.segments 


V_segment 


segment variable de la chaine legere et de la chaine lourde de rimmunoglobuline et des 
engines aipna, oeta et gamma du recepteur d un lymphocyte T ; codes applicables a la plus 
grande partie de la region variable (V.region) et aux quelques acides amines du peptide leader 
qui subsistent 


variation 


souche apparentee contenant des mutations stables du meme gene (par exemple : RFLP, 
polymorphismes, etc.) qui different de la sequence presentee a cet emplacement (et 
eventuellement a d'autres emplacements) 


3'clip 


region d'un transcrit precurseur situee en position 3', qui est coupee durant ia maturation 
moleculaire 


3'LITR 


rcyiuu en posiuon J a 1 extremite d un transcrit mature (qui suit le codon de terminaison) qui 
n est pas traduite en proteine 


5'dip 


region en position 5' d'un transcrit precurseur qui est coupee durant la maturation moleculaire 


5'UTR 


region en position 5' situee a I'extrerhite d'un transcrit mature (avant le codon d'initiation) qui 
n est pas traduite en proteine 


-lO^signal 


sequence de pribnow ; region consen/ee situee a environ 10 paires de bases en amont du site 
J: A DM^^'°," ^® transcription bacteriennes, qui peut jouer un role dans la fixation de . 
1 ARN polymerase ; consensus=TAtAaT 


-35_signal 


Hrrr^^t''®-''?"^^!?'^ ^^^"^ ^ environ 35 paires de bases en amont du site d'initiation des unites 
ae transcription bactenennes ; consensusaTTGACa [ ] ou TGTTGACA ( ] 
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Tableau 6 : liste des cles de caracterisation concernant les sequences de proteines 



Cle 


Description 


CONFLICT 


sequences differentes seion divers documents 


VARIANT 


les auteurs signalent qu'il existe des variants de la sequence 


VARSPUC 


description des variants de la sequence produits par une excision— epissage 
differentielle 


MUTAGEN 


site modifie a titre experimental 


MOO_RES 


modification post-traductionnelle d'un residu 


ACETYLATION 


N-terminal ou autre 


AMIDATION 


en general, au C-terminal d'un peptide mature actif 


BLOCKED 


groupe de blocage N- ou C-terminal indetermine 


FORMYLATION 


de la methionine N-terminale 


GAMMA- 

CARBOXYGLUTAMIC 
ACID HYDROXYLATION 


de Tasparagine, de I'acide aspartique, de la proline ou de la lysine 


METHYLATION 


en general, de la lysine ou de I'arginine 


PHOSPHORYLATION 


de la serine, de la threonine, de la tyrosine, de I'acide aspartique ou de I'histidine 


PYRROLIDONE 
CARBOXYLIC ACID 


glutamate N-terminal ayant forme un lactame cyclique interne 


SULFATATION 


en general, de la tyrosine 


LIPID 


liaison covalente d'un fragment lipidique 


MYRISTATE 


groupe myristate rattache, par une liaison amide, au residu N-terminal glycine de la 
forme mature d'une proteine ou a un residu de lysine interne 


PALMITATE 


groupe palmitate lie, par une liaison thio-ether, a un residu de cysteine ou, par une 
liaison ester, a un residu de serine ou de threonine 


FARNESYL 


groupe farnesoi rattache, par une liaison thio-ether, a un residu de cysteine 


GERANYL-GERANYL 


groupe geranyl-geranyi rattache, par une liaison thio-ether, a un residu de cysteine 


GPI-ANCHOR 


groupe glycosyl-phosphatidylinositol (GPI) lie au groupe alpha carboxyl du residu 
C-terminal de la forme mature d'une proteine 


N-ACYL DIGLYCERIDE 


cysteine N-terminaie de la forme mature d'une lipoproteine procaryote assortie d'un 
acide gras amide et d'un groupe glycerile auquel deux acides gras sont rattaches par 
des liaisons ester 


DISULFID 


liaison disulfure ; les extremites "FROM" et "TO" representent les deux residus qui 
sont lies par une liaison disulfure intrachaine ; si les extremites "FROM" a "TO" sont 
identiques, la liaison disulfure est une liaison interchaine et le champ de description 
donne ia nature de la liaison reticulee 


THIOLEST 


liaison thiolester ; les extremites "FROM" et "TO" representent les deux residus lies 
par la liaison thiolester 


THIOETH 


liaison thio-ether ; les extremites "FROM" et "TO" representent les deux residus lies 
par la liaison thio-ether 


CARBOHYD 


site de glycosylation ; la nature de Thydrate de carbone (lorsqu'elle est connue) est 
donnee dans le champ de description 


METAL 


site de fixation pour un ion metallique ; le champ de description donne la nature du 
metal 


BINDING 


site de fixation pour tout groupe chimique (coenzyme, groupe prosthetique, etc.) ; la 
nature chimique du groupe est donnee dans le champ de description 
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SIGNAL 


sequence-signal (prepeptide) 


TRANSIT 


peptide-transit (mitochondrial, chioroplastique ou destine a un micro-organismel 


PROPER 


propeptide 


CHAiN 


chaine polypeptidique dans la proteine mature 


PEPTIDE 


peptide actif libere 


DOMAIN 


domaine d'interet dans la sequence ; ta nature de ce domaine est donnee dans le 
champ de description 


CA_BINO 


region de fixation du calcium 


DNA_8IND 


region de fixation de I'ADN 


NP_BtND 


region de fixation d'un phosphate nucleotidique ; la nature du phosphate nucleo- 
tidique est donnee dans le champ de description 


TRANSMEM 


region transmembranaire 


2N_F1NG 


region d'un doigt de zinc 


SIMILAR 


similitude avec une autre sequence proteique ; des informations detaillees sur cette 
sequence figurent dans le champ de description 


REPEAT 


repetition de sequence interne 


HELIX 


structure secondaire - Helices, teiles que les helices alpha, les helices 3-10 ou les 
helices pi 


STRAND 


structure secondaire - Brin beta, tel que le brin beta a liaison hydrogenee ou le residu 
dans un brin isole a pent beta 


TURN 


structure secondaire - Virages, tels que le virage a liaison H (virage 3, virage 4 
ou virage 5) 


ACT_SiTE 


acides amines jouant un role dans I'activite de I'enzyme 


SITE 


tout autre site presentant un interet dans ta sequence 


INIT.MET 


la sequence commence par un initiateur methionine 


NON_TER 


le residu situe a une extremite de la sequence n'est pas le residu terminal ; applique a 
la position 1, cela signifie que la premie/e position n'est pas la position N-terminaie 
de la molecule complete ; s il est applique a la derniere position, cela signifie que 
cette position n'est pas la position C-terminaie de ta molecule complete ; il n'y a pas 
de champ de description pour cette cle 


NON_CONS 


residus non consecutifs ; indique que deux residus dans une sequence ne sont pas 
consecutifs et qu'll existe un certain nombre de residus non sequences entre eux 


UNSURE 


2Dnes d'incertitude dans la sequence ; sert a decrire les regions d'une sequence pour 
lesquelles les auteurs ne sont pas surs de la definition 
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Appendice 3 

Exemple de listage des sequences 



<1.I0> 


Sfuich, John; Smichgene Ii 


<120> 


example oc a S*2^uencs Li: 


<L30> 


01-00001 


<140> 


PCT/EP98/00001 


<14L> 


1993-12-3 1 


<150> 


US 08/999 999 


<15L> 


1997-10-15 


<lcO> 


4 


< 1.70 > 


Pacer.cin Version 2.0 


<2L0> 


1 


<2L1> 


389 


<212> 


DMA 


<213> 


Paramecium sp. 


<220> 




< 2 2 1 > 


CDS 


<222> 


(279) ... (38'9) 


<300> 




<3QL> 


Doe, Richard 


<302> 


Isolacion and Characceri 




from Paramecium sp . 


<303> 


Journal of Genes 


<304> 


1 


<3Q5> 


4 


<306> 


1-7 ■ 


<307> 


1988-06-31 


< J U d > 


1 T T /f C i 


<309> 


1988-06-31 


<400> 


1 


agccgcagcc 


acccccgcgc cccccccncc 


agggagagcg 


ccccgacccc cccccgcccc 


cgacgcggca 


accgccggca gcgccacagg 


cgcggcgcgg 


cggccccccc cgcgcccccc 


ggacccgac- 


agg cgagcag gaggaggggg 



ccgggcccct 
cgcagcccca 
ccccccagcc 
ccgcgccccc 



caccccgcca 
caggcaggca 
aggcccaggg 
cccccgcccc 



accagacccc 
ggcaggcagc 
cgggticccgc 
ccncccgccc 



a eg 
Mec 
1 



gcc 
Val 



cca 
Ser 



Mec 



ccc 
Phe 
5 



age 
Ser 



60 
120 
180 
240 

295 



ccg ccc 
Leu Ser 



ccc 
Phe 



aaa egg 
Lys Trp 
10 



cgc 
Cys 



ccc 
Pro 



■ aaa gcc 
Lys Val 
25 



ccc 
Leu 



ccc 
Pro 



ccc 
Pro 



gga ccc cgc 
Gly Phe Cys 
15 



cgc 
Cys 



cac 
Kis 
30 



cca 
Ser 



ccg 
Leu 



cca 
Ser 



ccc 
Phe 



ccg 
Leu 



gcc 
Val 



cag 
Gin 



■cgc ccg 
Cys Leu 
20 

ccg aac 
Pro Xsn 
35 



ccc 
Phe 



ccc 
Leu 



caa 
Gin 



344 



389 
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<210> 2 

<2ll> 37 

<212> ?RT 

<2I3> Paramecium sp . 

<400> 2 

Mec' Vdl Ser Mec Phe Ser Leu Ser Phe Lys Trp Pro Ciy Phe Cys Leu 
1 5 LO 15 

Phe Vai Cys Leu Phe GLn Cys Pro Lys Val Leu Pro Cys His Ser Ser 
20 25-30 

Leu Gin. Pro Asn Leu 
35 

<2L0> 3 
<211> 11 
<212> PRT 

<213> . .^rcicicial Sequen.ce 

<220> 

<223> Designed peptide based on size and polaricy co acc as a linker becween the 

aloha and beca chains of Procein XYZ 

<:400> 3 

Mec Val Asn Leu Glu Pro Mec Kis Thr Glu lie 
1 5 10 

<210> 4 
<4QQ> 4 
000 
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Mitteilung des Europiiischen 
Patentamts vom 2. Oktober 
uber die Darstellung von 
Nucleotid- und Aminosaure- 
sequenzen in Patentanmel- 
dungen und die Einreichung 
von Sequenzprotokollen 



Fur Internationale Anmeidungen 
nach dem PCT giit ab 1. Juli 19SS der 
"Scandard uber die Darstellung von 
Nucleotid- und Aminosauresequenz- 
procokollen in internacionaien 
Anmeidungen nach dem PCT"' 
(abgekunt "PCX-Standard", siehe 
negein 5.2, 12.1 (d) und 13''' PCT 
5Gwte Abschnin 208 und Anhang C 
der PCT-Verwaltungsvorschriften). 
Zum selben Zeitpunia is: WIPO- 
Scandard ST. 25 fur die Darstellung 
von Nucleotid- und Aminosaure- 
sequen^protokotlen in Patentanmel- 
dungen in Kraft getreten. Dieser neue 
WlPO-Standard, der die bisherigen 
VVlPO-Standards ST. 23 und ST. 2^ 
erseczt, empfiehit den Patentamtern, 
den PCT-Standard entsprechend auf 
alle Patentanmeidungen, bet denen 
es sich nicht um internationaie 
Anmeidungen handelt. anzuwenden. 



Gemad BeschluG des Prasidenren 
des EPA vom 2. Oktober 1998^ {nach- 
folgend "SeschluG des Prasidenren" 
genannt) ist der WlPO-Standard 
ST. 25 und damit der PCT-Standard 
fur das europaische Patenterceiiungs- 
verfanren ab dem 1. Januar 1999 
maf3gebend. 



Oiese Mitteilung erganzt den 
BeschluG des Prasidenten und 
eriautert das Verfahren nach dem 
E?U und dem PCT. 

I. Allgemeines 

Sett dem 1. Januar 1993 is: in Ver- 
fahran vor dem EPA nach dem EPU 
und dem PCT die Darstellung von 
Nucleotid- und Aminosauresequen- 
zen in Form eines standardisierten 
Sequenzprotokolls sowie dessen Ein- 
reichung auf einem elelaronischen 
Oatencrager zwingend vorgeschrte- 
ben. Der neue WIPQ Standard ST. 25 
erseczt die bisherigen Standards 
ST 23 und ST. 24. Damit werden 
neben der Berucksichtigung des 
cechnologischen Fortschrins Verein- 
fachungen, JCLarstellungen und 
Erleichterungen fur die Anmelder 



' AQgoarucKT in d»r PCT-G^zone lSond*rausgat>a) vom 

25.5.1998. 



Notice from the European 
Patent Office dated 2 October 
1998 concerning the presen- 
tation of nucleotide and 
amino acid sequences in 
patent applications and the 
filing of sequence listings 



The "Standard for the presentation of 
nucleotide and amino acid sequence 
listings in international applications 
urider the PCT"'* (or "PCT Standard", 
see Rules 5.2. 12.1(d) and 13"' PCT as 
well as Section 208 of and Annex C to 
the PCT Administrative Instructions) 
came into force for international 
applications under the PCT on 1 July 
1998. VVlPO Standard ST.25 for the 
presentation of nucleotide and amino 
acid sequences in patent applications 
also came into force on that date. 
This new WIPO Standard, which 
replaces WIPO Standards ST.23 and 
ST.2J-, recommends that patent 
offices also apply the PCT Standard 
mutatis mutandis to all patent appli- 
cations in addition to international 
applications. 



According to the decision of the Pres- 
ident of the European Patent Office 
dated 2 October 1998^ {hereinafter 
referred to as the "decision of the 
President"). WIPO Standard ST.25, 
and hence the PCT Standard, wilt 
enter into force for the European 
patent grant procedure on 1 January 
1999. 

This notice supplements the decision 
of the President and is intended to 
clarify the EPC and PCT procedures. 



I. General remarks 

The presentation of nucleotide and 
amino acid sequences in the form of 
a standardised sequence listing as 
well as the filing thereof on an elec- 
tronic data carrier has been manda- 
tory in proceedings before the EPO 
under the EPC and the PCT since 
1 January 1993. The new WIPO 
Standard ST.25 replaces Standards 
ST.23 and ST.24. It not only takes 
account of advances in technology, 
but also simplifies, clarifies and facil- 
itates procedures for the applicant. In 
particular, it will no longer be 
necessary to translate a sequence 



' S<ta i09ci4l adifion of ina PCT Cdiarcs of 
25 Jun« t998. 



Communique de {'Office euro- 
peen des brevets en date 
du 2 octobre 1998, relatif a la 
presentation du listage des 
sequences de nucleotides et 
d'acides amines dans les 
demandes de brevet et au 
depot de listages des 
sequences 

A compter du I**" juillet 1998. la norme 
applicable aux demandes internatio- 
nales au titre du PCT est la "norme 
relative a la presentation du listage 
des sequences de nucleotides et d'aci- 
des amines dans les demandes inter- 
nationales de brevet deposees selon 
le PCT"' (en abrege "norme du PCT", 
cf. regies 5.2, 12.1 d) et 13"' PCT ainsi 
que I'instruction administrative 208 et 
I'annexe C des Instructions adminis- 
tratives du PCT). A la meme date est 
entree en vigueur la norme ST. 25 de 
rOMPI relative a la presentation du 
lisrage des sequences de nucleotides 
er d'acides amines dans les deman- 
des de brevet. Certe nouvelle norme 
de i'OMPI, qui remplacs les normes 
ST. 23 et ST. 24 de I'OMPI qui etaient 
applicables jusqu'ici, recommande 
aux offices de brevets d'appliquer par 
anaiogie la norme du PCT pour toutes 
les demandes de brevet autres que les 
demandes internationales. 

Conformement a la decision du Presi- 
dent de I'OEB en date du 2 octobre 
1998^ (denommee ci-apres "decision 
du President"), la norme ST. 25 de 
rOMPI iet done la norme du PCT) est 
applicable a compter du 1*' janvier 
1999 pour la procedure de delivrance 
de brevets europeens. 

Le present communique complete la 
decision du President et fournit des 
explications concernant la procedure 
selon la C3E et selon le PCT. 

I. Generalites 

Dans les procedures au titre de la 
CBE ou du PCT se deroulant devant 
rOE3, il est exige imperativement 
depuis le 1*' Janvier 1993 la presen- 
tation d'un listage des sequences de 
nucleotides et d'acides amines sous 
forme de listage des sequences nor- 
malise, et le depot de ce listage sur 
un support electronique de donnees. 
La nouvelle norme. ST. 25 de I'OMPI 
remplace les normes ST. 23 et ST. 24 
qui s'appliquaient jusque la. II est 
tenu compte ainsi du progres tech- 
nique, et de plus la situation se voit 
simplifiee, clarifiee et facilitee pour 



aaofoduito dans la Gatsno du PCT. numero special du 
ZS juin 1998. 
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eingefuhrc. tnsbesondere soli der 
Zwang zur Ubersetiung ernes 
Sequenzprotokolls bei Verwendung 
fur verschiedeine Anmeldungen in 
verschredenen Sprachen dadurch 
enrfallen, dal3 das SequenzprotokoM 
uncer Verzich: auf unnotige sprach- 
tiche Angaben (ersetzt durch nume- 
rische Codes) und uncer Verwendung 
eines kontroMierten, von der Fachwelt 
allgemein anerkannten Vbkabulars 
formuliert wird. 

II. Europatsches Patenterteilungs- 
verfahren 

/. Sequenzprocokoll 

1.1 Die Darstellung von Nucleotid- 
und Aminosauresequenzen im vor- 
geschriebenen Sequenzprotokoll 
mud dem im Anhang zum Beschfuil 
des Prasidenten wiedergegebenen 
WIPO-Scandard ST. 25 und dannit 
dem PCT-Standard entsprechen (im 
fblgenden "Standard" genannt). 

1.2 Ein Sequenzprotokoll ist nur fiir 
solche Sequenzen einzureichen, die 
der Definition laut Nummer 2 (ii) des 
Standards entsprechen und sich auf 
die in der Anmeldung offenbarte 
Erfindung beziehen. 

Soweit in der Beschreibung auf 
Sequenzen Bezug genommen wird, 
die zum Stand derTechnik gehoren 
und in, allgemein zugangllchen 
Datenbanken auffindbar sind, ist es 
nicht erforderiich, solciie Sequenzen 
in das Sequenzprotokoll aufzuneh- 
men. Jedoch ist jede solcrie Sequenz 
hinreichend durch Angabe ihrer 
Datenbank-Zugangsnummer zu 
identifizieren. 



1.3 Wird ein Sequenzprotokoll 
zusammen mit den Anmeldungsun- 
teriagen, d. h. als Bestandteil der 
Beschreibung eingereicht, so sollen 
die Sequenzen nicht in der Beschrei- 
bung wiederhcit werden (siehe 
Standard, Nummer 3). 

^A Das Sequenzprotokoll kann ent- 
weder in der Sprache der Anmeldung 
Oder (bevorzugt) in Englisch abgefaGt 
werden. Sind Sequenzprotoll einer- 
seits und Beschreibung und Anspru- 
che andererseits nicht in derselben 
Sprache abgefaSt und enthalt das 
Sequenzprotokoll "freien Text" im 
Sinne des Standards {Nummer 33). 
so wird empfohlen, den freien Text 
am £nde der Beschreibung in der 
Sprache der Beschreibung gemaJl 
Nummer 36 des Standards wieder- 
zugeben (siehe Beispiele in der 
Aniage zu dteser Mineilung). Damit 
kann vermieden werden, daG Merk- 
male. die nur im sogenannten 
"freien Text" des Sequenzprotokolls 
angegeben sind, in einzelnen Ver- 



iisring used for different applications 
in different languages, as sequence 
listings can be formulated without 
unnecessarv text (replaced by nume- 
rical codes) and using a limited voca- 
bulary of terms generally recognised 
in the field. 



II. European patent grant procedure 



7. Sequenca liszing 

1.1 The presentation of nucleotide 
and amino acid sequences in the 
prescribed sequence listing must 
comply with VVIPO Standard ST2S, 
reproduced in the annex to the 
decision of the President, and thus 
with Che PCT Standard (hereinafter 
referred to as the "Standard"). 

1.2 A sequence listing need only 
be filed for those sequences 
matching the definition given in 
the Standard, paragraph 2 (ii), and 
relating to the invention disclosed 
in the application. 

Where the description refers to 
sequences which belong to the prior 
art and can be found in generally 
accessible databases, it will not be 
necessarv to include such sequences 
in the sequence listing. However, 
each such sequence must be identi- 
fied adequately by its database 
access number. 



1.3 Where a sequence listing is 
riled together with the application 
documents, ie as part of the 
description, the sequences should 
not be repeated in the description 
(see Standard, paragraph 3). 



^A The sequence listing may be 
wriaen either in the language of filing 
or (preferably) in English. Where the 
sequence listing on the one hand and 
the description and claims on the 
other are not in the same language, 
and the sequence listing contains 
"free text" within the meaning of the 
Standard (paragraph 33), it is recom- 
mended that the free text be repeated 
at the end of the description in the 
language of the description in 
accordance with paragraph 36 of the 
Standard (see examples in the annex 
to this notice). This will ensure that 
features which are given only in the 
so-called "free text" of the sequence 
listing are not deemed in individual 
contracting states to the EPC not to*-. . 



les demandeurs. II n'y aura notam- 
nnenc plus lieu d'exiger la traduction 
d'un meme listage des sequences 
figurant dans differences demandes 
redigees dans des iangues differen- 
tes. Du fait quo les indications lin- 
guistiques superflues disparaitront 
du listage des sequences (elles 
seront remplacees par des codes 
numeriques) er qu'il sera utilise un 
vocabulaire controle, universellement 
reconnu par les hommes du metier, 

II. Procedure de delivrance des 
brevets europeens 

7. Listage des sequences 

1.1 La presentation du listage present 
des sequences de nucleotides et 
d'acides amines doit atre conforme a 
la norme ST. 25 de I'OMPl reprodutte 
dans I'annexe a la decision du Pre- 
sident, et done a la norme du PCT 
(denommee ci-apres "la norme"). 



1.2 II n'y a lieu de deposer de listage 
des sequences que pour les sequen- 
ces correspondant a la definition 
figurant au paragraphe 2(ii) de la 
norme et se rapportant a I'invention 
exposee dans ta demande. 

Dans la mesure ou il est fait reference 
dans la description a des sequences 
qui sont comprises dans Tetat de la 
technique et que Ton peut trouver 
dans des banques de donnees acces- 
sibles au public, ii n'est pas neces- 
saire d'integrer ces sequences dans 
ie listage des sequences.. Toutefois il 
convient d'identifier sufflsamment 
toutes ces sequences en indiquant 
leur numero d'acces dans la banque 
de donnees. 

1.3 Si un listage des sequences est 
depose en meme temps que les 
pieces de la demande, c'est-a-dire en 
tant que partie de la description, il n'y 
a pas lieu de raprendre les sequences 
dans la description (cf. norme, 
paragraphe 3). 

lA Le listage des sequences peut 
etre redige soit dans la langue de la 
demande, soit (de preference) en 
anglais. Si Ie listage des sequences, 
d'une part, et la description et les 
revendications, d'autre part, ne sont 
pas rediges dans la meme langue, et 
que le listage des sequences ne 
comporce pas de "texte libre" au 
sens de la norme (paragraphe 33), il 
est recommande de repeter le texte 
libre a la fin de la description, dans la 
langue de la description, conforme- 
ment au paragraphe 36 de la norme, 
ce qui permenra d'evirer que dans 
certains Etats parties a la CBE des 
caracteristiques qui ne sont indi- 
quees que dans Ie "texte libre" du 
.listage des sequences ne soient pas 
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u.igsGraaren des EPU aufgrund der 
oorache nicht als Gegenstand der 
'jr^prGnglichen Offenbarung ange- 
'j^ihen werden. 



2. Eiekzronischer Oatentrager 

2. 1 Die Einreichung des Sequenz- 
protokolls auf einem elekironischen 
O.irentrager zusarzlich zur schriftli- 
chen Form ist vorgeschrieben. Die 

n riheren Einzslheiten uber die zuge- 
iossenen Datentrager, ihre Kenn- 
r'iichnung, das Format der darauf 
g^speichercen Information und 
die erforderliche Hardware sind 
ct'icn Standard (Nummern 39 ff.-) zu 
entnehmen. 

2.2 Das EPA empfiehit die Verwen- 
dung der Sofr^vare Patentln, die uber- 
arbeitet worden ist (Version 2.0) und 
den Anmeidern kostenlos zur Verfu- 
gung steht. Durch Verwendung 
dieser Software (in der jeweils 
gultigen Version) kann der Anmelder 
erraichen, daG die Formerfordernissa 
nach Regei 27a (!) E?U erfullt sind. 
Oie Software kann von der Website 
des EPA heruntargeladen werden 
und eignet sich fur PCs, die mit dem 
Betriebssystem Windows (Version 
3.1 Oder hoher) ausgestanet sind. 
Weitere Informationen sind erhalt- 
iich bei: 



bfi the subject-maner of the original 
disclosure because of the language 
used. 



Z Electronic data carriers 

2.1 Sequence listings must be sub- 
mitted on an electronic data carrier 
as well as in written form. Further 
details with regard to authorised 
data carriers, their identification, the 
format for the information recorded 
on them and the necessan/ hardware 
are set out in the Standard (para- 
graphs 39 ff). 



2.2 The EPO recommends the use of 
Patentln software, which has been 
upgraded (version 2.0) and is avail- 
able to applicants free of charge. By 
using the (applicable) version of this 
software, applicants can ensure that 
the physical requirements under Rule 
■27a(l) EPC are met. The software can 
be downloaded from the EPO's 
website and is suitable for use with 
Windows 3.1 or above. Further 
information can be obtained from: 



considerees comme Tobjet de la 
divulgation initiale. en raison de la 
difference existant entre la langue 
utilisee dans la description et ceile 
utilisee dans le cexte libre. 

2. Support efectronique de donnees 

2.1 La production du listage des 
sequences sur un support electro- 
nique de donnees en plus du listage 
imprime est obligatoire. Des preci- 
sions concernant les supports elec- 
troniques admis, leur identification, 
le format des informations y figu- 
rant et le materiel necessaire sont 
donnees dans la norme (paragra- 
phes 39 s.) 



2.2 L'OES recommande I'utilisation 
du logiciel Patentln, qui a ete revu 
(version 2.0) et est mis gratuitement 
a la disposition des demandeurs. Le 
demandeurqui utilise ce logiciel 
(dans la version en vigueur) est en 
mesure de satisfaire aux conditions 
de forme prescrites a la regie 27bis 
(1) C3E. Le logiciel peut etre dechar- 
ge a partir du site web de TOES et 
convient pour les PC qui sont equipes 
du programme d'exploitatipn 
Windows (version 3.1 ou versions 
suivantes). Pour plus d'informations 
s'adresser a : 



Europaisches Patentamt 

Programm STRAND 

Patentlaan 2 

ML-2288 EE Rijswtjk 

Fax: (+31-70) 340 3992 

E-mail: Patentin_heip.europatent.org 

2.3 deschadigtar oder unfesbarer 
Datentrager 

Is: der zusammen mit der Anmel- 
dung eingereichte Datentrager 
beschadigt Oder aus einem anderen 
Grund nicht lesbar, so wird der 
Anmelder aufgefordert, einen ein- 
wandfreien Datentrager innerhalb 
einer nicht veriangerbaren Frist von 
einem Monat ab Zustellung der ent- 
sprechenden Mineilung nachzu- 
reichen. 

J, Srklarung gemaG Regei 27a (2) 
EPU 

Der vorgeschriebene Datentrager 
wird fur die EDV-gestutrte europai- 
sche Oder Internationale Recherche 
sowie. nach der Veroffentlichung der 
Anmeldung, fur die laufende Aktua- 
lisierung der internationalen Patent- 
Sequenzdatenbank bendtigt. 



Die auf dem Datentrager gespei- 
cherte Information muS mit dem 
schriftlichen SequenzprotokoU uber- 



European Patent Office 

STRAND program 

Patentlaan 2 

NL-22a8 EE Rijswfjk 

Fax: (+31-70) 340 3992 

e-maii: Patentin_help.europatent.org 

2.3 Damaged or unreadable data 
carriers , . 

If a data carrier submiaed to the EPO 
is damaged, or unreadable for some 
other reason, the applicant will be 
invited to submit a flawless replace- 
ment within a non-extendabie period 
of one month from notification of the 
communication. 



3, Statement under Rule 27a(2) EPC 



The prescribed data carrier is 
required for EDP-based European 
or international searches and, after 
publication of the application, for 
continuous updating of the inter- 
national patent sequence database. 



The information recorded on the 
data carrier must be identical to the 
wrinen sequence listing. This must 



Office europeen des. brevets 

Programme STRAND . 

Patentlaan 2 

NL-22a8 EE Rijswijk 

Fax; (+31-70) 340 3992 

E-mail : Patentin_help.europatent.org 

2.3 Support de donnees endommage 
ou fllisible 

Si le support de donnees depose en 
meme temps que la demande est 
endommage ou iilisible pourquelque 
autre raison, le demandeur est invite 
a deposer un support de donnees en 
parrait etat dans un delai d'un mois a 
compter de la signification de la noti- 
fication correspondante ; ce delai ne 
peut etre prolonge. - 

3. Declaration prevue a la regie 
27 bis (2) C8E 

Le support de donnees prescrit est 
necessaire pour la recherche euro- 
peenne ou Internationale assistee 
par ordinateur ainsi que, apres la 
publication de la demande, pour la 
mise a jour constante de la banque 
Internationale de donnees relatives 
aux sequences contenues dans les 
brevets. 

L'information figurant sur ce support 
doit etre identique a cede que con- 
tient le listage imprime des sequen- 
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einstimmen. Der Anmelder oder seln 
Veareter hat dies sicherzustellen und 
eine entcprechende Erklarung gemai3 
Regel 273 (2) E?0 zusammen mic 
dem Dacentrager einiureichen (siehe 
auch Standard. Nummer lO). Eine 
soic^ie Erklarung ist im Eneiiungs- 
anirag enchaiten (EPA Form 1001. 
Feld 31)^ Sie kann als Musrererkla- 
rung auch bei Nachreichung des 
Datentragers verwendet werden. 



Scellt die Prufungsabteilung fes:, 
dail der eingereichce Dacentrager das 
Identicatserfordernis nicht erfullt und 
somit die Erkiarung gemaS Regal 
27a (2) EPU unrichtig isr. so kann dies 
zur Zuruckweisung der Annneidung 
nac'n Arcike! 97 (1) E?U fuhren. Dar- 
uber hinaus kann ein anderer Stand 
der Technik einschlagig sein, ais er 
der Prijfung zugrunde geleg: wurde. 
Dies kann zu einer anderen Beunei- 
lung der Patentierbarkeitsvoraus- 
setzungen durch die jeweils 
zustandigen Instanzsn aucn nach 
Patencerteilung fuhren. 

d. Nachrelchung ernes Sequenz- 
protokolfs 

4.1 1st ein Sequenzprotokoll einzu- 
reichen, so ist es den Anmeldungs- 
uncertagen als Tail der Beschrei- 
bung betzufugen (siehe Standard, 
Nummer 3). 

*1.2 Gleichwohi nimmt das EPA auch 
nach dem Anmeidetag eingereichta 
Sequenzprotokolie entgegen, sofern 
der vorgeschriebene Datentrager und 
die Erklarungen gemaS Rege! 27a (2) 
und (3) EPU vorltegen, weil dies fur 
die Ourchfuhrung der Recherche und 
die Forcschreibung der internatio- 
naten Patent-Sequenzdatenbank 
sinnvoil isi. 



4-. 3 Ein spacer eingereichces Sequenz- 
protokoll ist jedoch nicht Bestandteii 
der Beschreibung und kann daher fur 
die Bestimmung des ursprunglichen 
Offenbarungsgehalts der Anmeldung 
nicht herangezogen werden (Regel 
27a W EPU). 



be ensured by the applicant or 
his representacive, who must file 
together with the data carrier a 
statement in accordance with Rule 
27a(2) E?C (see also Standard, 
paragraoh 40). The statement is 
contained in the Request for Grant 
(EPO Form 1001, section 31H. and 
may also be used as a model state- 
ment when the data carrier is filed 
subsequently. 



If the examining division finds that 
the data carrier submined does noc 
comply with the requirement that it 
be identical and the statement under 
Rule 27a (2) EPC is therefore incor- 
rect, this may lead to refusal of che 
application under Article 97(1) EPC. 
Furthermore, a different prior art than 
that on which the examination was 
based may be relevant. This may 
lead to a different assessment by the 
relevant departments or courts of the 
conditions for patentability, even 
after a patent has been granted. 



d. Subsequent filing of a sequence 
liszing 

4.1 If a sequence listing has to be 
filed, it.should be annexed to the 
application documents as part of 
the description (see Standard, 
paragraph 3). 

4.2 Nevertheless, the EPO accepts 
sequence listings filed after the date 
of filing so long as the prescribed 
data carrier and the statements under 
Rule 27a(2) and (3) EPC have been 
received because they can be useful 
in the search and for updating the 
international patent sequence 
database. 



4.3 A sequence listing filed later 
does not, however, form part of the 
description and cannot therefore 
be used in determining the original 
disclosed content of the apolicacion 
(Rule 27a(4) EPC). 



ces. Le demandeur ou son manda- 
taire est tenu de prendre les mesures 
necessaires a cet effer ec de joindre 
au suppoa de donnees une declara- 
tion en ce sens, conformement a ia 
regie 27bis (2) CBE (cf. egalement la 
norme. paragraphe 40). Une telle 
declaration figure dans la requete en 
delivrance (OEB Form 1001. rubrique 
31)\ Elle peut egalement etre utiiisee 
comme declaration type en cas de 
production ulterieure du support de 
donnees. 

St la division d'examen constate que 
le support de donnees ne satisfait 
pas a I'exigence d'identite avec 
la liste ecrite ec que la declaration 
selon la regie 27bis (2) CBE est 
done inexacte, la demande peut etre 
rejetee conformement a I'arcicie 97(1) 
CBE. II se peut en outre qu'un ecat de 
la technique autre que celui qui a ete 
pris en compte pour I'examen soit 
pertinent et qu'il en resuJte une 
appreciation dtvergente par les 
instances competentes des condi- 
tions de brevetabilite meme apres 
la delivrance du brevet. 

4. Depot utterieur d'un listage des 
sequences 

4.1 Tout listage des sequences doit 
etre joint aux pieces de la demande 
comme faisant parcie de la descrip- 
tion (cf. norme, paragraphe 3). 

4.2 L'OEB accepte neanmoins les 
listages deposes apres la date de 
depot, dans la mesure ou te support 
de donnees present et les declara- 
tions selon la regie 27bis (2) et (3) 
CBE ont ete produits, etant donne 
que ces informations sont utiles pour 
effectuer la recherche et actualiser ia 
banque internationale de donnees 
relatives aux sequences contenues 
dans les brevets. 

4.3 Un listage de sequences depose 
ulterieurement ne fait toutefois pas 
parcie de la description et ne peut 
done sen/ir a determiner le contenu 
initial de la demande (regie 27bts (-) 
C3E1. 



4.4 1st der Anmelder nicht imstande, 
das Sequenzprotokoll mit der Anmel- 
dung einzureichen, sollte er es von 
sich aus baldmoglichst nachreichen 
und die weiteren Erfordernisse nach 
Regel 27a (2) und (3) EPU erfullen 
(Eihreichung des vorgeschriebenen 
Oatentragers und der vorgesehenen 
Erklarungen, siehe auch Punkt 11.5). 
Andernfalls forderc ihn die Eingangs- 
stelle auf, die festgesteilten Mangel 
innerhalb einer Frist von zwei Mona- 



4.4 If the applicant is unable to file 
the sequence listing with the de- 
scription, he should file it without 
prompting as soon as possible 
thereafter and comply with the other 
requirements under Rule 27a{2) 
and (3) EPC {see also point 11.5 for 
submission of the prescribed data 
carrier and statements). Otherwise, 
the Receiving Section will invite him 
to remedy the deficiencies within a 
period of two months (Article 91(2), 



4.4 Si le demandeur n'esc pas en 
mesure de deposer le listage des 
sequences avec la demande, il a 
interet a en effectuer spontanement 
le depot ulterieurement dans les 
meilleurs delais, en veillant a remplir 
les autres conditions enoncees a la 
regie 27bfs (2) et (3) CBE (production 
du support de donnees prescrit ec 
des declarations prevues; cf. egale- 
ment point 11.5). Sinon, la section de 
depot I'invite a remedier dans un 



' Abqadructn tm aSI. EPA 1997. jsi. 
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ten :u beheben (Art. 91 (2). Regel 
-J' M 1) EPU und Aaikel 3 des 
3'^::i:hlusse3 des Prasidencen). Die 
rn;)t wird einmal um hochstens zwei 
Monate verlangea. sofern der 
Anmelder dies vor Ablauf der Frist 
brjjntragt. In begrundecen Ausnah- 
.-nrjfallen kann die Frisr auch von 
Amr3 wegen verlangerc werden, 
wenn nicht atie Mangel innerhalb der 
cejetzten Fris: beseitigt worden sind. 
Wird innerhalb dieser Frisr ein 
beschadigter oder aus einem ande- 
ren Grund un/esbarer Datentrager 
eingereicht. so wird dem Anmel- 
der sine besondere. nicht verlanger- 
oar^ Fris: von einem Monat ab 
-jsrellung der entsprechenden Mir- 
ceilijng zur Nachreichung eines ein- 
v^andfreien Oarentragers eingeraumt. 

S^E^^kiarung gem at! Regel 27 a (3) 

Ein nachgereichtes Sequerrzprocokoll 
daa nichts enthaiten, das uber 
den Inhalt der Anmeldung in der 
ursprungiich eingereichten Fassung 
ninausgeht. da die Recherche auf 
der Grundlage des nachgereichten 
Sequenzprocokolls durchgefuhrt 
wird. Das nachgereichte Sequenz- 
procokoil dar^ daher nur diejenige 
Sequenzinformarion - in standardi- 
sierter Form - enthalten, die in den 
ursprunglichen Anmeldungsunter- 
iagen bereits vorhanden war. Es ist 
Linbedingt darauf zu achten, daS das' 
nachgereichte Sequenzprotokoll nicht 
mehr und nicht weniger Sequenzen 
als die in der ursprunglichen 
Seschrei.bung offenbarten Sequenzen 
enchalt und die Numerierung dieser 
Sequenzen unverandert bleibt. Der 
Anmelder hat dies sicherzustellen 
und eine entsprechende Erklarung 
cemafi Rege! 27a (3) EPU einzurei- 
chen. Es wird empfohlen, hierfur die 
in der FuBnote abgedruckte Muster- 
erklarung* zu verv/enden. Fur den 
-ebenfalis einzuraichenden Daten- 
trager gilt Punk: 11.3. 

5. Rechcsverfus: 

Werden die Erfordernisse der Regel 
27a EPU in Verbindung mit dem 
BeschluQ des Prasidenten nicht 
rechtzeitig. gegebenenfalls nach 
Auf^orderung der Eingangsstelle 
gemaft Regel 41 (i) EPU, erfullt, 
so wird die Anmeldung zuruckge- 
wiesen (Art. 91 (i) b) und (3) EPU). 

Der Anmelder kann die Weiterbe- 
handlung der Anmeldung nach 
Artikel 121 EPU beantragen. 



Rul^e ^1(1) EPC and Article 3 of the 
dticision Of Che President), This 
period may be e.xtsnded once only 
for J maximum of two months, 
provided that che aoplicant requests 
such an extension before the period 
expires. In exceptional, substantiated 
cases, the period may be extended 
by the Receiving Section of its own 
motion where not all the deficiencies 
have been remedied within the 
prescribed period. If a data carrier is 
filed which is damaged, or unread- 
able for some other reason, the 
applicant will be granted a special, 
non-extendable period of one month 
from notification of the communica- 
tion within which to file a flawless 
replacement. ' 



5. Scatement under Rule 27a(3) EPC 



A subsequently filed sequence listing 
may not include any maaer which 
goes beyond the content of the applir 
cation as filed, since the search is to 
be carried out on the basis of the 
subsequently filed sequence listing. 
The subsequently filed sequence 
listing may therefore contain only 
the sequence information - in a 
standardised form - that was already 
in the original application docu- 
ments. The subsequently filed 
sequence listing should contain no 
more and no fewer sequences than 
disclosed in the original description, 
and their numbering should remain ' 
unchanged. This must be ensured by 
the applicant, who must file a state- 
ment to that effect in accordance with 
Rule 27a{3) EPC. It is recommended 
that the specimen statement in 
footnote* below be used for this 
purpose. Point II. 3 is applicable for 
the data carrier which must also be 
submined- 



6. Loss of rights 

If the requirements laid down in Rule 
27a EPC in conjunction with the 
decision of the President are not met 
in good time - if applicable, after an 
invitation from the Receiving Section 
under Rule *tl(l) EPC - the applica- 
tion is refused (Art. 91(11{b) and (3) 
EPC). 

The applicant may request further 
processing of the application under 
Article 121 EPC. 
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delai de deux mois aux irregularites 
conatatees (an. 91(2). regie 4i(i) 
C3E et art. 3 de la decision du Presi- 
dent). Le delai est prolonge une seule 
fois de deux mois au maximum, si 
le demandeur presente une requete 
en ce sens avant I'expiration cu delai. 
Cans des cas exceptionnels. si la 
situation le justifie. le delai peut 
egalement etre prolonge d'office. 
s'il n'a pas ete remedie a toutes les 
irregularites dans le delai fixe. S'il 
est depose dans ce delai un support 
de donnees endommage ou rendu 
iltisibie pour quelque autre raison, il 
est imparri au demandeur un delai 
special non prorogeable d'un mois 
a compter de la signification de la 
notification correspondante invitant 
le demandeur a deposer un support 
de donnees en parfait etat. 

5. Declararion prevue a la regie 
27bis (3) C3E 

Un listage des sequences depose 
ulterieurement ne doit contenir 
aucun element s'etendant au-dela du 
contenu de la demande telle qu'elle a 
ete deposee, puisque la recherche es: 
executee sur ta base de ce listage. Le 
listage des sequences depose ulte- 
rieurement ne doit contenir - sous 
forme normalisee - que les informa- 
tions concarnant les sequences qui 
figuraient deja dans les pieces initia- 
les de la demande. II faut absolument 
veiller a ce que le listage des sequen- 
ces depose ulterieurement ne con- 
tienne ni plus ni moins de sequences 
que celles qui sont divulguees dans 
la description initiale et a ce que la 
numerotation de ces sequences 
demeure inchangee. Le demandeur 
est tenu de faire le necessaire a cet 
effet et de produire une declaration 
en ce sens conformement a la regie 
27bis (3) C3£. II est recommande 
d'utiiiser a cene fin la declaration 
type reproduite dans la note en bas 
de page"^. Le point 11.3 est applicable . 
au support de donnees que le 
demandeur doit en outre produire. 

o. Perre de droits 

Si le demandeur ne satisfait pas en 
temps utile aux conditions enoncees 
a la regie 27bis C3E en liaison avec la 
decision du President de TOES, le cas 
echeant apres y avoir ete invite par la 
section de depot conformement a la 
regie 41 (i) C8E, la demande est 
rejetee (arc. 91(l)b) et (3) CoE). 

Le demandeur peut demander la 
poursuite de la procedure confor- 
mement a Tarticle 121 C8E, 



- = i vird ni«rm,t iritlifT. daQ das S*Qu«n:orOtotio)l 
n.cnr uO«f <3«n Innatt d«r Anm«ldun<j \n der ursofunq- 
lien *tnqtfr»tcntan Psssung ninausgsnt.' 



'tt I J narfov decMrfd mat ivtn laausnes listing doas 
not go aavond tn« content the dooticjtton as filed. 



'W'fii declare oar la oresanto qu« <• tisraga des 
teauances no s'atend sas au-daia du sontenu da *a 
demands taite au'tiie a -jta deoosav.* 
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III. V«rfahron vor dem EPA als Inter- 
n.itionaler Recherchenbehorde oder 
ol:; mit der internationalen voriaufi- 
g.:n Prufung beauftragter Sehorde 



1. 3equen:DrotokoUe in maschinen- 
lesbarer Form warden fur die 
Ourchfuhrung der incernanonalen 
inet;rierche ebenso benbiigt wie fur 
Oi'i -europoische Recherche. Sie mus- 
Sr^n dem PCT-Scandard antsprechen 
{n.jgel 5.2 ?CT sowie Abschnin 208 
und Annang C der PCT-Vervvaltungs- 
voroChrifien). 

Liegt ein dtesem Standard entspre- 
cht^ndes Sequenzprorokoll zu Seginn 
der inrernationalen Recherche nich: 
od-if nichr auf eiekironischem Daren- 
crager vor, so wird der Anmelder vom 
SPA aufger'order:, das Sequenzpro- 
cokoll und/oder den vorgeschriebe- 
nen Oatentrager innerhalb einer nicht 
veriangerbaren Frist von maximal 
zwei Monaten nachzureichen (Regel 
13"M a) PCi). Diese wird wegen der 
engen Frisian der Regei iz PCX fur 
die trstetlung des Recherchenbe- 
richts regeimatlig nur einen Monat 
betragen. 



2. Bei Nachreichung des Sequenz- 
protokolls und/oder des Oatentragers 
hat der Anmelder zu erklaren, dad 
das nachgereichte Saquenzprotokol! 
nicht uber den Inhalt der Anmeldung 
in der ursprunglich eingereichten 
FasGung hinausgeht und/oder die 
auf dem Oatentrager gespeicherte 
Information mit dem schriftlichen 
SequenzprotokoH ubereinstimmt 
(Art. 4 des Beschiusses des Prasi- 
denten und Standard, Nummern 37 
und J-O). 

3- Werden diese crfordernisse nicht 
Oder nicht rechtzeitig erfullt, so 
fuha das EPA keine internationaie 
Recherche durch, soweit eine sinn- 
volle Recherche nicht moglich ist 
(Regel 13"M c) PCT). In diesem Fall 
wind der internationaie Recherchen- 
bericht ganz oder teilweise durch die 
Erklarung gemall Artikel 17 (2) PCT 
ersetzt. 



J.. Ist der internationaie Recherchen- 
bericht aus den vorgenannten Grun- 
den nicht oder nur teilweise ersrelit 
worden, so fuhrt das EPA als mit der 
internationalen vorlaufigen Prufung 
beauftragte Sehorde keine inter- 
nationaie vprlaufige Prufung durch. 
soweit eine sinnvoile Prufung nicht 
moglich ist (Regel 66.1 e) PCT). Dies 
wird dem Anmelder mitgeteilt und im 
internationalen vorlaufigen Prufungs- 
bericht vermer'ct (Regeln 56.2 a) vii) 



III. Proceedings before the EPO as 
lnt*;rnational Searching Authority or 
International Preliminary Examining 
Authority 



1. Sequence listings in machine 
readable form are just as necessary 
in carp/ing out the international 
search as they are for the European 
search. They must comply with the 
PCT Standard {Rule 5.2 PCT as well 
as Section 203 of and Annex C to the 
PCT Administrative Instructions). 



If at the start of the international 
search a sequence listing complying 
with this Standard has not been 
received or has not been received 
on an electronic data carrier, the 
EPO invites the aopiicant to file 
the sequence listing and/or the 
prescribed data carrier within a non- 
extendable period of not more than 
TWO months (Rule 13"M(a) PCT). 
Sacause of the short time limits in 
Rule -t.2 PC t for the establishment of 
the search report, this period will 
normally be only one month. 



2. if the sequence listing and/or 
data carrier is filed subsequently, 
the applicant must state that the 
sequence listing so filed does not 
include matter which goes beyond 
the content of the application as filed 
and/or that the information recorded 
on the data carrier is identical to the 
written sequence listing (Article 4 of 
the decision of the President, and 
Standard, paragraphs 37 and 40). 



3. If these requirements are not met 
or not met in due time, the EPO does 
not perform the international search 
where a meaningful search cannot be 
carried out (Rule 13'-M(c) PCT). In this 
case the international search report is 
replaced in full or in part by the 
statement under Article 17(2) PCT. 



4. If Che international search report 
has not been drawn up in full or in 
part for the aforementioned reasons, 
the EPO as International Preliminan/ 
Examining Authority does not per- 
form the international preliminary 
examination where a meaningful 
examination cannot be carrried out 
(Rule 56.1(e) PCT). This is notified to 
the applicant and stated in the inter- 
national preliminan/ examination 
report (Rules 65.2(a)(vii) and 70.12(tv) 



III. Procedure devant I'OES agisGont 
en qualite d'administration chargee 
de la recherche internationaie ou 
d'administration chargee de I'exa- 
men preliminaire international 

1. Les listages des sequences sous 
rorme decniffrable par machine sont 
necessaires tant pour la recherche 
Internationale que pour la recherche 
europeenne. Us doivent etre etablis 
coni=ormement a la norma du PCT 
(regie 5.2 PCT ainsi que instruction 
administrative 208 et annexe C des 
Instructions administratives du PCT). 

Si un listage des sequences con- 
forme a cette norme n'ast pas par- 
venu a rOE3 ou bien s'il n'est pas 
disponible sur support electronique 
da donnees lorsque la recherche 
internationaie est entreprise, le 
demandeur est invite par I'OEB a 
fournir dans un delai non proro- 
geable de deux mois au- maximum la 
listage et/ou le support de donnees 
present (regie 13^'M a) PCT). Ce delai 
ne sera normalement que d'un mois 
en raison des delais tres stricts fixes 
par la regie 42 PCT pour I'eta- 
biissement du rapport de recherche 
internationaie. 

2. Lorsqu'il fournit ulterieurement le 
listage des sequences et/ou !e sup- 
port de donnees, le demandeur est 
tenu de declarer que ce listage ne 
s'etend pas au-dela du contenu de la 
demande telle qu'elle a ete deposee 
et/ou que I'information figurant sur 
ce support est identique a celle que 
contient le listage imprime (art. 4 de 
la decision du President at norme, 
paragraphes 37 et 40). 



3. Si ces conditions ne sont pas 
remplies ou ne le sont pas dans les 
delais, rOE3 ne procede pas a la 
recherche internationaie dans la 
mesure ou une recherche significa- 
tive ne peut pas etre effectuee (regie 
13'-M c) PCT). Dans ce cas, le rapport 
da recherche internationaie est rem- 
place en tout ou en partie par la 
declaration prevue a I'article 17(2) 
PCT 

4. Si le rapport de recherche interna- 
tionaie n'a pas ete etabli, ou n'a ete 
etabli qu'en partie, pour les raisons 
qui viennent d'etre enoncees, I'OEB 
agissant en qualite d'administration 
chargee de I'examen preliminaire 
international ne procede pas a I'exa- 
men preliminaire internationsi dans 
la mesure ou un examen significatif 
ne peut pas etre effectue (regie 65.1 
e) PCT). L'OEB en informe le deman- 
deur ec I'indique dans le rapport 
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unc!^70.12 iv) PCTK Eine Aufforderung 
cur Einreichung eines Sequenzpro- 
rokoH:; gemarL Regel 13**M (e) PCX 
ergeht nicht. 



Es wrrd nachdruckiich davon abge- 
raten. -*in Sequenzprotokoll ersT in 
diesam soaten Stadium einzureichen. 
Zumlndest bei umfangreichen 
Sequenzen ware das EPA nich: in der 
Lage zu uberprufen. ob das Sequenz- 
protokoll uber den Offenbarungsge- 
halt der interna:ionalen Anmeidung 
im Anmeidezeitpunk- hinausgeht. Zu 
einer derarrigen Uberprurung isT es 
nach AfTike! 3a (2) b) und Regel 55.2 
(a) iv) PCT zwar verpfiichrer. Anders 
ais bei der incernacionalen Recherche 
kann eine Erklarung des Anmelders, 
daG das na'chgereichte Sequenz- 
procokoll nicht uber den Offenba- 
rungsgehalt der internationalen 
Anmeidung im Anmeidezeitpunkt 
hinausgehe, das EPA nicht von einer 
eigenen Uberprufung dieses Tatbe- 
srandes (Artikel 34. (2) b), Regel 
65.2 a) PCT) enrbinden. Es gibt aber 
derzeic keine geeigneten Minel, die 
einen zufriedensteflenden Vergieich 
der ursprunglichen Anmeldungs- 
unteriagen mit dem nachgereichten 
Sequenzprotokoll zu vercretbarem 
Aufwand ermoglichen konnten. 
Oaher konnte der internationaie 
vorlaufige Prufungsbericht nicht auf 
der Grundlage des nachgereichten 
Sequenzprotokolls, sondern nur auf 
der Grundlage der am Anmeldetag 
in der Beschreibung vorhandenen 
Sequenzen ersrellt werden. 



IV. Eintritt der Euro-PCT-Anmeldun- 
gen in die regronale Phase vor dem 
EPA 



PCT). An invitation under Rule 
i3'-'.Me) PCT to file a sequence 
listing 13 not issued. 



Applicants are strongly advised no: 
to file sequence listings at this late 
stage. In the case of long sequence 
listings at least, the European Patent 
Office would not be in a position to 
examine whether the sequence list- 
ing goes beyond the content of the 
international application as disclosed 
at Che time of filing, although under 
Article 3d(2)(b) and Rule 65.2(a)(iv) 
PC I it is Obliged to earn/ out such an 
examination. Unlike the situation 
pertaining to the international search, 
a statement from the applicant to the 
effec: that the subsequently filed 
sequence listing does not go beyond 
the content of the international 
application as filed cannot release the 
EPO from its obligation to carry out 
its own examination (Article 3^(2){b), 
Rule 56. 2(a) PCT). However, there is 
at present no appropriate means of 
carrying but a satisfactory compari- 
son of the documents as originally 
filed with the subsequently filed 
sequence listing. The international 
preliminary examination report 
therefore could not be established on 
the basis of the subsequently filed 
sequence listing but only on the basis 
of the sequences available in the 
description on the date of filing. 



IV. Entn/ of Euro-PCT applications 
into the regional phase before the 
EPO 



d'examen preliminaire international 
(regies 65.2 a) vii) ec 70.12 iv) PCT) II 
n est pas envoye d'invication a deoo- 
ser un listage des sequences confor- 
mement a la regie 13"M e) PCT. 

11 es: rout a fait deconseille de ne 
decoser un listage des sequences 
qu'a cs stade tardif de la .procedure. 
Tout au moins dans le cas de 
sequences longues, t'OE3 ne serait 
pas en mesure de verifier si le listage 
des sequences ne s'etend pas *au-dela 
de I'expose de I'invention figurant 
dans ia demande internationaie a ia 
dace du depot. II est certes tenu de 
prcceder a une telle verification en 
vertu de I'articie 3-1 (2) b) et de la 
regie 55.2 a) iv) PCT mais con- 
trairement a ce qui se passe dans le 
cas ce la recherche internationaie, ii 
ne suffit pas que le demandeur 
declare que le listage des sequences 
depose ulterieurement ne s'etend pas 
au-de!a de I'expose de I'invention 
figurant dans la demande internatio- 
naie a ia date du depot pour que 
rOE3 puisse se dispenser de proce- 
der lui-meme a cette verification 
(article 34 (2) b), regie 65.2 a) PCT). 
loutefois il n'existe pas actuellement 
de moyen approprie permenant 
d'etabiir une comparaison satisfai- 
sants, ne necessitant pas une somme 
de travail excessive, entre les pieces 
initiaies de la demande et le listage 
des sequences depose ulterieure- 
ment. C'est pourquoi ie rapport 
d'examen preliminaire international 
ne saurait etre etabli sur la base du 
listage des sequences depose ulte- 
rieurement, mais uniquement sur la 
base des sequences rlgurant dans la 
description a la date du depot. 

IV. Entree des demandes euro-PCT 
dans la phase regionale devant I'OEB 



^. Liegt ein nach Regel 5.2 PCT vorge- 
schriebenes Sequenzprotokoll bei 
Ablauf der internationalen Phase 
dem EPA ais Bestimmungsamt oder 
ausgewahttem Amt nicht vor, ent- 
spricht es nicht dem Standard oder 
ist der vorgeschriebene Oatentrager 
(siehe Standard. Nummern 39 ff.) 
nicht eingereicht worden, so wird der 
Anmelder aufgefordert. die festge- 
srellten Mangel innerhalb einer Frist 
von zwei Monaten zu beheben (Regel 
13'-.2 PCT Regel lO^b {3a) EPU und 
Artikel 5 des Beschlusses des Prasi- . 
denten). Gegebenenfatls wird der 
Anmelder aufgefordert, gieichzeitig 
zu erklaren, daG das nachgereichte 
Sequenzprotokoll nicht uber den 
Inhalt der Anmeidung in der 
ursprunglich eingereichten Fassung 
hinausgeht und/oder die auf dem 



1. If on expiry of the international 
phase the sequence listing prescribed 
in Rule 5.2 PCT is not available to the 
EPO as designated Office or elected 
Office or does not comply with the 
Standard, or if the prescribed data 
carrier (see Standard, paragraphs 
39 ff) has not been filed, the appli- 
cant is invited to remedy such defi- 
ciencies within a period of two 
months (Rule 13'".2 PCT, Rule 
10J.b(3a) EPC and Article 5 of the 
decision of the President). Where 
appropriate, the applicant is invited 
at the same time to state that the 
subsequently filed sequence listing 
does not go beyond the content of 
the application as filed and/or that 
the information recorded on the data 
carrier is identical to the written 
sequence listing (Standard, para- 



1. Si, au terme de la phase interna- 
tionaie, le listage des sequences vise 
a ia regie 5.2 PCT n'est pas par/enu a 
rO£3 agissant en qualite d'Offics 
designe ou d'Office eiu, n'a pas ete 
etabli conformement a la norme ou 
n'a pas ete produit sur le support de 
donnees prescrit (cf. norme. para- 
graphes 39 s.), le demandeur est 
invite a remedier dans un delai de 
deux mois aux irregularites consta- 
tees (regie 13*«'.2 PCT, regie 104.^"' 
(3bis) CBE et article 5 de la decision 
du President). Le cas echeant, le 
demandeur est invite a declarer en 
meme temps que !e listage des 
sequences depose ulterieurement ne 
s'etend pas au-dela du contenu de la 
demande telle qu'elle a ete deposee 
ei/ou que I'information figurant sur le 
support de donnees est identique a 
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2. Warden besrehende Mangel nach 
einer solchen Aufforderung nicht 
Oder nicht rechtseitig beseitigt. so 
wird die Anmeldung zuruckgewiesen 
(An. 91 (3) EPU). 

3. Der Anmelder kann die Weiter- 
behandlung der Anmeldung nach 
Artikel 121 EPU beantragen. 

*i. Ubersetzung gemaB Artikel 153 (2) 
EPU 

Einer Ubersetzung der Textstellen 
eines SequenzproEokolls, das 
Besrandteil der Beschreibung ist. 
bedarf es grundsatztich nicht, sofern 
das Sequenzprotokoll der Regel 
12.1 (d) PCT und die Beschreibung 
der Regel 5.2 (b) PCT entspricht 
(Regel 49.5 (a-b/s) PCT). 1st die Vor- 
aussetzung nach Regel 5.2 (bl PCT 
nicht erfullt, so veriangt das EPA 
keine solche Ubersetzung, wenn das 
Sequenzprotokoll in englisch abge- 
faBc ist und die internationaie Anmel- 
dung in einer anderen £PA-Amts- 
sprache (deutsch Oder franzosisch) 
veroffentlicht worden ist. 

V. Veroffentlichung von 
Sequenzprotokollen durch das EPA- 
Akteneinsicht 

1. 1st das Sequenzprotokoll zusam- 
men mit den Unterlagen der euro- 
paischen Patentanmeldung (oder 
internationalen Anmeldung) als Teil 
der Beschreibung eingeretcht wor- 
den, so wird es zusammen mit der 
Anmeldung durch das EPA (oder 
durch das Internationale Biiro) 
veroffentlicht. 



2. If existing deficiencies are not 
remedied or not remedied in due 
time after such an invitation, the 
application is refused (Art. 91(3) EPC). 



3. The applicant may request further 
processing of the application under 
Article 121 EPC. 

4. Translation in accordance with 
Article 153(2) EPC 

There is no requirement to translate 
any text maner in a sequence listing 
which forms part of the description, 
provided that the sequence listing 
complies with Rule 12.1(d) PCT and 
the description with Rule 5.2(b) PCT 
(Rule 49.5{a-6/s) PCT). If the require- 
ment under Rule 5.2(b) PCT is not 
met, the EPO does not require such a 
translation where the sequence list- 
ing is in English and the international 
application has been published in 
one of the other official languages of 
the EPO (French or German). 



V. Publication of sequence listings by 
the EPO - inspection of files 



1. If the sequence listing has been 
filed together with the documents 
making up the European (or inter- 
national) application as part of the 
description, it is published together 
with the application by the EPO (or 
the International Bureau). 



2. Si, apres une telle invitation, le 
demandeur ne remedie pas aux 
irregularites constatees ou n'y reme- 
die pas en temps utile, la demande 
est rejetee (art. 91(3) CSE). 

3. Le demandeur peut demander la 
poursuite de la procedure conforme- 
ment a I'articie 121 CBE. 

4. Traduction conformement a 
I'articie 158(2) CSE 

II h'est pas necessaire en tout etat 
de cause de deposer une traduction 
des elements de texte d'un listage 
des sequences qui fait partie de 
la description, si ce listage des 
sequences est conforme a la regie 
12.1 d) PCT et si la description est 
conforme a la regie 5.2 b) PCT (regie 
49.5 (a-b/5) PCT). Si la condition 
requise a la regie 5.2 b) PCTn'est pas 
remplie, I'OEB n'exige pas une telle 
traduction si le listage des sequences 
est redige en anglais et si la demande 
internationaie a ete pubiiee dans une 
autre langue officielle de I'OES 
(allemand ou fran<;ais). 

V. Publication par rOEB des listages 
des sequences - inspection publique 

1. St !e listage des sequences a ete 
depose en meme temps que ies 
pieces de la demande europeenne ou 
internationaie comme partie de la 
description, il est public avec la 
demande par I'OEB (ou par le Bureau 
international). 



2. Wird ein Sequenzprotokoll zu einer 
«uropaischen oder zu einer in der 
regionalen Phase vor dem EPA 
anhangigen internationalen Anmel- 
dung nachgereicht, so hangt seine 
Veroffentlichung von dem Zeitpunkt 
der Einreichung ab (Artikel 6 des 
Beschlusses des Prasidenten): 

Wird es rechtzeitig vor AbschluG der 
technischen Vorbereitungen fur die 
Veroffentlichung der europaischen 
Patentanmeldung^ eingeretcht, so 
wird es als Anlage zu den Anmel- 
dungsunterlagen (A-Schrift) oder im 
Falle einer Euro-PCT-Anmeldung, die 
nicht in einer Amtssprache des EPA 



2. If a sequence listing pertaining to 
a European patent application or to 
an international application in the . 
regional phase before the EPO is 
subsequently filed, its publication 
depends on the date of filing (Article 
6 of the decision of the President); 



If it is filed in due time before com- 
pletion of the technical preparations 
for publication of the European 
patent application*, it is published as 
an annex to the application docu- 
ments (A document) or, in the case of 
a Euro-PCT application which has not 
been published internationally in one 



2. Si le listage des sequences d'une 
demande europeenne ou d'une 
demande internationaie se trouvant 
en instance devant I'OEB dans la 
phase regionale a ete depose ulte- 
rieurement, sa publication depend 
de la date de son depot (article 6 de 
la decision du President). 

S'il est depose en temps utile avant- 
la fin des preparatifs techniques 
entrepris en vue de la publication de 
la demande de brevet europeen^, il 
est publie en annexe aux pieces de la 
demande (document A) ou, s'il s'agit 
d'une demande euro-PCT qui n'a pas 
fait I'objet d'une publication interna- 



7 wocn.n vor AoUuf von 18 Monatan n«:n dem 
Anm,)d«. oamr Pnorttatstaq; SMCftlua des 
?ri„u,nten des EPA vom I*. Oezamoer 1992. 
A3I. SPA 1993, SS. 



S*v«n weeks defore exoiry ot the 4ighieenm montft 
foHowing the dete of filing or pnoritv: Oocision of tn« 
President of the =?Q dated U Oacemoer 1992. 
OJ SPO 1993. 55. 



Sect sematnes avant ranoiration <j'un delai de 
dix-huif mois j comotor de la dare de deoOt ou de 
P"Orite : decision du President de rQE3 an date 
1* decennore T992. JO 063 1993 55 
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international veroffentlichc warden 
i'sz. Qls Aniage zu der nach Artikel 153 
{31 £?U vgrbffenclichten Obersecrung 
mitveroffentticht. 

In alien anderen Fallen besteh: nur 
die iVldglichkeic. bei. Patencarreilung 
cas SequeniQrorokoll zusammen mit 
Cer Patencschrir: zu veroffenrlichen. 
Oie Verdf^enctichung des nachge- 
r^icncen Sequenjprotokolls zusam- 
rr.en mie dem gesonderten Recher- 
chenbericht (sogenannie A3-Schrif:) 
is: nicht vorgesehen. 



3. Ein bequenzDrotokolL das nich: 
C'jsammen mir den Annneldungs- 
uncertagen Oder mic der Paisntschrif: 
verorfentlichr wird, is: gegebenenfalls 
nur durch Akianeinsicht Oder uber 
die Parent- Sequenzdatenbanken der 
Offentlichkeit zugangiich. Auf Antrag 
wird Alcteheinsicht auch durch Her- 
stellung und Zusendung einer Kopie 
des vom Anmelder eingereichten 
e!6!<xroni3chen Oatenrragers gewahrc 
(siehe 11.2 und IV.i und Regel 94 (3) 
EPU). 



of the oKicial languages of the EPO. 
as an annex to the translation pub- 
lished under Article 153(31 EPC. 



In all other cases it is only possible to 
publish the sequence listing together 
with the patent specification when 
the patent is granted. There is no 
provision for publishing the subseq- 
uently filed sequence listing together 
with the separate search report (A3 
document). 



3- A sequence listing which is not 
published together with the applica- 
tion documents or with the patent 
specification is, where applicable, 
accessible to the public only by way 
of a file inspection or by way of the 
patent sequence databases. On 
request, inspection of files may also 
be granted by sending the requester 
a copy of the electronic data carrier 
filed by the applicant (see 11,2 and IV.I 
and Rule 94.(3) EPC). 



tionale dans une langue officielle de 
rOE3, en anne.xe a la traduction 
publiee conformement a i'aaicle 
153(3) C3E, 

Oans tous les autres cas. la seule 
possibilite consiste. si la demande 
donne lieu a la delivrance d'un 
brevet, a publier le iistage des 
sequences avec le fascicule de 
brevet. II n'es: pas prevu qu'un 
Iistage des sequences depose 
ulterieurement soit publie avec 
le rapport de recherche separe 
(document A3). 

3. Un Iistage des sequences qui 
n'est publie ni avec les pieces de la 
demande ni avec le fascicule de 
brevet n'est le cas echeant accessible 
au public que dans le cadre de I'ins- 
pection pubiique ou par I'interme- 
diaire de la banque de donnees 
relatives aux sequences contenues 
dans les brevets. 11 est egalement 
procede, sur requete, a I'inspection 
pubiique, par etablissement et envoi 
d'une copie du support de donnees 
electronique produit par le deman- 
deur (cf. 11.2 et IV.l et regie 34(3) 
C3E). 
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Aniage zu der Mitteilung 
des Europaischen Patentamts 
vom 2. Oktober 1998 uber die 
Darstellung von Nucieotid- 
und Aminosauresequenzen 
in Patentanmeldungen und 
die Einreichung von Sequenz- 
protokollen* 

Freier Text d«><; -?^q. jenzDrorot.nli^ 

Beisptel 1: 

Dies isr ein Beispiel des Abschnirrs 
"Freier Text des Sequenzprotokolls" 
(vgL Nummer 36 des WlPO-Stan- 
dards ST. 25) in der Beschreibung 
einer in Franzosisch eingeretchten 
europaischen oder internationalen 
Patenranmeldung, die ein Sequenz- 
protokoll mit Freitexrelementen in 
Englisch zur Sequenz Nr. 3 enthalt: 



Appendix to the Notice from 
the European Patent Office 
dated 2 October 1998 con- 
cerning the presentation 
of nucleotide and amino 
acid sequences in patent 
applications and the filing 
of sequence listings' 

Sequence Listing Frgf* Tov-y 

Fxampte 1: 

This is an example of a "Sequence 
Listing Free Text" section (see para- 
graph 36 of WlPO Standard ST. 25) in 
the description of a European patent 
application or international applica- 
tion riled in French and containing 
a sequence listing with English free 
text data elements for Sequence 
No. 3: 



Annexe au Communique de 
('Office europeen des brevets 
en date du 2 octobre T998, 
reiatif a la presentation du 
iistage des sequences de 
nucleotides et d'acides 
amines dans les demandes 
de brevet et au depot de 
iistages des sequences* 

Texre libre du li<:t;^r|a des s«^q ii>»n^^^ 

Exemple 1 : 

Ceci est un exemple de la rubrique 
particuliere de la description intitulee 
"texte libre du Iistage des sequen- 
ces" (voir te paragraphe 36 de la 
norme OMPl ST.25 ) pour une 
demande de brevet europeen ou une 
demande internationale deposee en 
fran9ais et contenant un Iistage des 
sequences comportant des elements 
de texte libre en anglais pour la 
sequence n"* 3 : 



<210> 3 

<223> /note^"PCV" 

/hote specifique="Sus scrofa" 
/type de tissu=''rein" 
/lignee celIulaire="PK-15" 

<223> So?o^n d^^^^ au circovirus de plante et au motif nonanucleotide de geminivirus" 

/note="similaire au circovirus BSTV de plante" 
/P''oduit="site de replication de la proteine associee au PCV" 

dT?o7yad/nylS " associee au PCV a lieu 6 nucleotides en aval du signal 

<223> /note="TAGTATTAC homologue au circovirus de plante et au motif nonanucleotide de geminivirus" 



Beispiel 2: 

Dies ist ein Beispiel des Abschnitts 
"Freier Text des Sequenzprotokolls" 
(vgl. Nummer 36 des WIPO-Standards 
ST. 25) in der Beschreibung einer in 
Deutsch eingereichten europaischen 
Oder internationalen Patentanmel- 
dung, die ein Sequenzprotokoll mit 
Frsitextelementen in Englisch zur 
Sequenz Nr. 3 enthalt: 



Example 2 

This is an example of a "Sequence 
Listing Free Text" section (see 
paragraph 36 of WlPO Standard 
ST. 25) in the description of a Euro- 
pean patent application or interna- 
tional application filed in German 
and containing a sequence listing 
with English free text data elements 
for Sequence No. 3; 



Exemple 2_: 

Ceci est un exemple de la rubrique 
particuliere de la description intitulee 
"texte libre du Iistage des sequen- 
ces" (voir le paragraphe 36 de la 
norme OMPI ST25 ) pour une 
demande de brevet europeen ou une 
demande internationale deposee en 
ailemand et contenant un Iistage des 
sequences comportant des elements 
de texte libre en anglais pour la 
sequence n"* 3 : 



<210> 3 

<223> /Anmerkung="PCV" 

/Spezifischer Wirc="Sus scrofa" 

/GewebetYp="Niere" 

/2ellinie="PK-75" 

No"n^-%ucSmSC— pflanzlichem Circovirus- und Geminivirus-spezifischem 
<223> /Startcodon =: 1 

/Anmerkung=="ahnlich dem pflanzlichen Circovirus B8TV" 
77-7 ;^'*°^^**^=''*ReplikationsstelIe des assoziienen Proteins PCV" 
; ^f:::^^::^ PCV ... S N^CeCde s:ror.a.w.rxs 

NoZ n':cKJ^.SC^^^ ^" P^lan.icheo. Circ,virus- .nd Geminivirus-spezifiscHen. 



» woini u I,* au communiQua raoroouit dans 1* 



prssont suDOtam.»nt. p. 50. 



Eurootfjn Potent Office :EPO) 
Office -iurooeen des brevurs (0631 
S 0-J0298 MuncMen 
^ :-i0*a9) 2399*0 
TeM.x/Tfilex: 523 556 ^omu d 
Fax: (--19-39) 2399-^^65 

Internet: ntTa;.Vw'yv'A/.e uroDean-oatenc-office.org 



. -wfriqstelle Den Haorj 
Bf.incri ai Th- Hague 
Oeonrtemeni de Lj Haye 

Postdus saia 

3 .\L-2280 HV Rijswijk 

(*31-70) 3^0-20*10 
Telex/Telex: 31 651 epo nl 
Fax: (-31-70) 3^0-3016 



Oienstsietle Be'lin 
Brirlin sub-office 
-igence de Berlin 
S 0-10953 Berlin 
e t*.i9-30) 25901-0 
Fax: 1*49-30) 2590l-3*iO 



Oiens;stelle Wien 
Vienna sub-office 
Agence de Vienne 
Postfach 32 
Schonenfeldgasse 29 
■a A-1072 Wien 
S (.43-1) 52126-0 
Telex/Teiex: 136 337 inpa a 
Fax: (-43-1) 52125-5491 



THIS PAGE BLANK (uspiioy 



